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RESUMO 


As anêmonas do mar são organismos sésseis que empregam um aparato peçonhento 
(localizado preferencialmente em seus tentáculos) para produzir e inocular toxinas paralisantes 
em suas presas ou para defender-se. Nosso grupo contribuiu recentemente na caracterização 
do peptidoma de 3 espécies de anêmonas do mar, mostrando que a diversidade molecular das 
toxinas desses organismos é muito maior que o esperado. Do ponto de vista da informação 
nucleotídica obtida das anêmonas, poucas espécies foram investigadas em detalhe, revelando 
que no momento apenas uma pequena fração do arsenal tóxico dos cnidários foi investigado. 
Adicionalmente, novas proteínas estruturais que ocorrem em anêmonas apresentam uma 
similaridade gênica e estrutural impressionante com proteínas de organismos derivados, 
tal como vertebrados. Neste sentido, pretendemos analisar e comparar o transcriptoma de 
duas populações da anêmona brasileira Bunodosoma caissarum, uma população da costa 
de São Paulo e outra população localizada no arquipélago isolado São Pedro e São Paulo. 
Essa análise será feita através do sequenciamento de RNA de nova geração, pelo sistema 
Ilumina. Com esse sequenciamento e com análises de bioinformática esperamos encontrar 
informações referentes a novas toxinas nunca antes estudadas nessa espécie e também 
analisar as diferenças no perfil de expressão entre as duas populações. 





ABSTRACT 


Sea anemones are sessile organisms that employ a venomous apparatus (preferably located in 
their tentacles) to produce and inoculate paralyZing toxins in their prey or to defend themselves. 
Our group recently contributed to the characterization of the peptidoma of 3 species of sea 
anemones, showing that the molecular diversity of the toxins of these organisms is much higher 
than expected. From the point of view of the nucleotide information obtained from anemones, 
few species were investigated in detail, revealing that at the moment only a small fraction of 
the toxic arsenal of the cnidarians was investigated. In addition, new structural proteins that 
occur in anemones present structural and genetic similarity to proteins of derived organisms, 
such as vertebrates. In this sense, we intend to analyze and compare the transcriptome of two 
populations of the Brazilian anemone Bunodosoma caissarum, a population of the São Paulo 
coast and another population located in the isolated São Pedro and São Paulo archipelago. 
This analysis will be done through the sequencing of new generation RNA, by the Illumina 
system. With this sequencing and with bioinformatics analyzes we hope to find information 
regarding new toxins never before studied in this species and also to analyze the differences 
in the expression profile between the two populations 


INTRODUÇÃO 


As anêmonas-do-mar são animais sésseis do filo Cnidaria, o mesmo filo das águas- 
vivas, e são divididos em quatro classes, no qual as anêmonas fazem parte da classe 
Anthozoa, junto com os corais verdadeiros. Esses animais possuem uma simetria radial 
e apresentam apenas duas camadas celulares: a ectoderme e gastroderme, com uma 
matriz extracelular entre elas, chamada mesogleia. São essencialmente predadores de 
crustáceos e peixes (1,2). 


Esse filo recebeu esse nome por causa de uma estrutura especifica que esses 
animais possuem: o cnidócito. Essas células especializadas servem tanto para defesa 
quanto para predação e conseguem inocular sua toxina, que contém uma ampla variedade 
de componentes, através de uma estrutura cnamada nematocisto (3), que lembra uma 
espécie de arpão que perfura o tecido do alvo após ser estimulada fisicamente. Embora 
existam aproximadamente 30 tipos de cnidócitos distintos os cnidários contém apenas uma 
pequena fração dessas diferentes células (2). 


Desde a década de 70 que as anêmonas começaram a serem estudadas para se 
entender o mecanismo de ação de suas toxinas. Nessa década tivemos alguns trabalhos 
muito elucidativos sobre as características das toxinas desses animais (4,5). Um desses 
trabalhos foi o trabalho pioneiro de Beress, no qual conseguiram purificar três pólipeptídeos 
com atividade neuronal e cardiológica, da anêmona Anemonia sulcata, onde foi investigado 


a ação e mecanismos das toxinas ATX-lI, Il e III. (6). 


O estudo aprofundado das toxinas das anêmonas do mar tem se mostrado um 
campo bem proveitoso para identificação de possíveis novos fármacos. Um exemplo é 
a toxina ShkK, da anêmona caribenha Stichodactyla helianthus. Essa toxina é um potente 
bloqueador de canais de potássio dependente de voltagem, que atualmente foi usada como 
modelo para o desenvolvimento de uma droga capaz de bloquear especificamente o canal 
de potássio dependente de voltagem 1.3, presentes em linfócitos T, que são mediadores de 
doenças autoimunes, como lúpus (7,8). 


Conforme as tecnologias vão evoluindo, mais ferramentas são utilizadas na 
investigação em busca de novas toxinas, e uma dessas novas tecnologias mais promissoras 
é o sequenciamento de nova geração. No entanto, poucos trabalhos com anêmonas do mar 
foram publicados utilizando esses novos métodos. A técnica de sequenciamento de mRNA 
que os sistemas de sequenciamento de nova geração proporciona uma grande ferramenta 
no trabalho de prospecção de novas toxinas, pois é possível analisar todo o material que 
está sendo expresso em proteínas no animal (9,10). 

O objetivo do trabalho é utilizar-se da capacidade de sequenciamento do sistema 
Ilumina para analisarmos todo o transcriptoma de duas populações distintas da anêmona 
Bunodosoma caissarum, uma população da costa de São Paulo (denominada Bcs-SP) e 
outra população isolada no Arquipélago São Pedro e São Paulo (denominada Bcs-Ag), 


no Oceano Atlântico. Com os dados do transcriptoma das populações de Bunodosoma 
caissarum temos também como objetivo analisar esses dados em busca de possíveis 
novas toxinas e também compararmos o perfil de transcriptoma das diferentes populações. 


REVISÃO BIBLIOGRÁFICA 


O FILO CNIDARIA 


O filo Cnidaria compreende o grupo de seres vivos que primeiramente apresentaram 
tecidos diferenciados na evolução em nosso globo. Esses animais são divididos em quatro 
classes: Hydrozoa, Scyphozoa, Cubozoa e Anthozoa, esse último o qual as anêmonas 
fazem parte, junto com os corais verdadeiros. Esses animais possuem uma simetria radial 
e possuem apenas duas camadas celulares, a ectoderme e gastroderme, com um matriz 
extracelular entre elas chamada mesogleia (1,2). 


Esse filo compartilha uma estrutura especifica que todos esses animais possuem: o 
cnidócitos. Essas células urticantes tem a função de defesa, ajudar na competição espacial 
interespécies e também de predar as presas que servem de alimento para os cnidários 
(1). Essas células especializadas conseguem inocular as toxinas através de uma estrutura 
chamada nematocisto, que lembra uma espécie de arpão que perfura o tecido do alvo após 
ser estimulada fisicamente (2). 


ESTUDOS DAS TOXINAS 


Atualmente são conhecidas 255 toxinas de cnidários, divididas em 19 diferentes 
famílias, nos quais encontramos, por exemplo, neurotoxinas que atuam em canais de sódio 
e canais de potássio, com peso molecular por volta de 5 kDa. Também são conhecidas 
toxinas enzimáticas, com ações conhecidas como formadoras de poros em corpos celulares 


(conhecidas como citolisinas, com 18-20 kDA), fosfolipases e metalloproteases (1,2,11). 


Os estudos das toxinas das anêmonas são relativamente recentes, com o primeiro 
trabalho sobre toxinas de cnidários sendo publicado em 1968, num estudo sobre purificação 
da toxina da anêmona Condylaciis gigantea (12) sendo seguido em 1975 de outro trabalho, 
de Beress, sobre a purificação de polipeptídeos com atividade de neurotóxicas presentes 
na peçonha da anêmona Anemonia sulcata (6). 


Em seu trabalho de 1975, Laszlo Béress e colaboradores purificaram e isolaram 
inicialmente 3 neurotoxinas peptídicas onde duas (com tamanho entre 45 e 50 aminoácidos), 
homólogas entre si, tiveram demonstrado os seus efeitos na inativação de canais de sódio 
dependentes de voltagem. Em trabalho posterior Caterral e Béress demonstraram que um 
desses peptídeos purificados no trabalho de 1975 (Toxin Il) possui um sítio receptor similar 
ao encontrado em toxinas inibidores de ionóforos de sódio nos axônios neurais e músculos 
dos escorpiões Leiurus quinquestriatus e Buthus tamulus (13). 


Atualmente já se conhece várias outras toxinas de cnidários, com os mais 
diferentes alvos farmacológicos, sendo responsáveis pelo desenvolvimento de drogas, 
tanto terapêuticas como também inseticidas. Em suas toxinas as anêmonas possuem um 
armamento para os mais diversos alvos: peptídeos formadores de poros em membranas 
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celulares, neurotoxinas bloqueadoras de canais de potássio e de sódio, inibidores de 
proteases e fosfolipases. Esse trabalho apresentará uma revisão sobre as famílias de toxina 
actinoporina e as neurotoxinas bloqueadoras de canal de potássio do tipo | (1,2,14,15), 
sendo essas famílias o foco de uma análise mais profunda na sessão de discussão. 


Actinoporinas: Toxinas citolísticas de anêmonas do mar 


Várias espécies de anêmonas do mar apresentam toxinas citolíticas denominadas 
Actinoporinas, que exibem uma ampla diversidade de atividades biológicas, incluindo 
hemólise de glóbulos vermelhos, agregação de plaquetas, efeitos citotóxicos e citostáticos 
em fibroblastos, atividade cardiotrópica, despolarização de membranas e bloqueio de 
canais de potássio (16). As actinoporinas são toxinas protéicas que danificam membranas 
celulares formando poros. Essas citolisinas em geral, são moléculas grandes se comparadas 
com as neurotoxinas de anêmonas e tem por volta de 20 kDa com uma estrutura 
B-sandwich flanqueada por duas a-hélices (ver a estrutura tridimensional na Figura 01), 
outra característica distintiva em relação à maioria das neurotoxinas de anêmona é que as 
actinoporinas não contém pontes dissulfeto. Letalidade em mamíferos tem sido atribuída a 
vasoespasmo grave dos vasos coronários, arritmia cardíaca e efeitos inotrópicos (17,18). 


Essas toxinas formam uma família bem caracterizada chamada de Actinoporin 
family. Entretanto, toxinas similares foram encontradas no ducto de peçonha de caramujos 
predadores do gênero Conus por análise transcriptômica e proteômica (19,20), sendo 
denominadas teroporinas ou conoporinas. Sequências similares também foram encontradas 
nos gametófitos de briófitas (21). Assim a família das actinoporinas atualmente é composta 
por 35 sequências que se subdividem em três subfamílias conforme sejam originárias 
de anêmonas do mar (Actinoporinas subfamília Actiniaria), ou de sequências similares 
presentes nas peçonhas de moluscos predadores do gênero Conus (Actinoporinas 
subfamília Conoidea), ou de plantas (Actinoporinas subfamília Plantas). 
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Actinoporin: Delta-actitoxin-Afria 





anterior posterior lateral 


anpsDo 


Figura 1-: Estrutura de uma Actinoporina. A figura mostra a estrutura tridimensional do monômero 
da Delta-Actitoxin-Afrta (UniProtKB - B9W5G6) (PDB - 4WDC) em verde o B-sandwich, em roxo as 
a-helices. Montagem da unidade biológica de simetria cíclica (C8) utilizou o modelo PDB - 4TSY. A 

figura mostra as vistas anterior, posterior e lateral. A a-helice N-terminal atravessa a bicamada lipídica 
sendo mais bem percebida na vista anterior e lateral. Modelagem feita com o software Chimera 
(chimera-1.11.2) e editado pelo software Corel Drawn (versão X3) 


A principal característica destas toxinas é que a partir da interação inicial do 
monômero com a membrana celular, ocorre um processo de automontagem em quatro 
estágios, até formar um poro hidrofílico seletivo para íons catiônicos que culmina na 
estimulação cardíaca ou hemólise. O primeiro estágio é chamado de estágio hidrossolúvel 
ou hidrofílico e corresponde à toxina em sua forma monomérica livre. O segundo estágio 
envolve o reconhecimento específico de esfingomielina da membrana pelo monômero da 
toxina (mas não o colesterol, nem a fosfatidilcolina) através de vários sítios de ligação 
específicos, usando uma região rica em resíduos aromáticos e com colaboração de 
lipídios fosfocolina adjacente ao local de ligação na membrana, que ocorre principalmente 
através de interações hidrofóbicas. O terceiro estágio envolve uma oligomerização parcial 
(dimerização) acompanhada pela transferência da região N-terminal da toxina para a 
interface lípido-água até finalmente a total oligomerização resultando na imersão das 
a-helices N-terminais na membrana envolvendo 8 subunidades da toxina (Figura 01) com a 
formação de um poro toroidal seletivo para cátions (22-25). 


Interessantemente, as anêmonas do mar não sofrem dano, pois suas membranas 
celulares possuem um análogo fosfonoesfingolipideo no lugar de esfingomielina que é o 
aceptor inicial de reconhecimento (26). Por sua atividade lítica as actinoporinas são toxinas 
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letais para crustáceos, moluscos e pequenos peixes. Também devido à sua atividade 
citolítica, as actinoporinas de anêmonas têm potencial de aplicação farmacológica na 
terapia de câncer, especialmente em associação com anticorpos específicos criando 


imunotoxinas capazes de lisar seletivamente células tumorais (27,28). 


De forma geral as actinoporinas da subfamília das anêmonas são expressas na 
forma de um precursor, normalmente entre 212 aminoácidos de tamanho, composto por 
um peptídeo sinal de aproximadamente 19 aminoácidos, seguido por um pró-peptídeo 
de tamanho variável (16 a 20 aminoácidos) rico em aminoácidos ácidos correspondendo 
à sequência consenso de endereçamento para o nematocisto (29) incluindo a díade 
básica que indica o ponto de clivagem para a toxina madura com aproximadamente 
179 aminoácidos. Os sítios de ligação com fosfocolina e com lipídios de membrana são 
identificados por ensaios de ligação e mutagênese-sítio dirigida também são mostrados em 
toxinas de referência no alinhamento da figura 08. 


Toxinas bloqueadoras de canais de potássio depende de voltagem do tipo 
|- SHKT 

Canais de potássio são uma parte muito importante para a vida, pois regulam o 
potencial de membrana celular dos seres vivos, portanto toxinas que atuam sobre esses 
canais são de grande interesse para a ciência. A primeira toxina bloqueadora de canais de 
potássio encontrada em anêmonas do mar foi a ShKT, da Stichodactyla helianthus [P29187] 
(30), formando uma nova família de toxinas bloqueadoras de canais de potássio do tipo | 
(sea anemone type 1 potassium channel toxin family). Essa toxina causou interesse pois 
bloqueava o canal Kv1.3, que estão envolvidos na proliferação de Linfócitos-T, tornando 
esse peptídeo um potencial imunossupressor (31,32). Também foi isolada da anêmona 
Bunodosoma granulifera uma toxina similar à ShKT, que recebeu o nome Bgk (P29186) 
(33). As toxinas similares à ShKT receberam a classificação de toxinas bloqueadoras de 
canal de potássio do tipo 1a, enquanto as similares à BgK receberam a classificação tipo 
1b. 
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Figura 2: Estrutura tridimensional das toxinas ShK e BgK. Em verde é mostrado a estrutura 
tridimensional da ShK (PBD: 4LFS) e em rosa a estrutura da BgK (PDB: 1BGK). Em amarelo se indica 
a representação das pontes dissulfeto por sua ligação pelos carbonos-B e numeradas segundo a 
posição em cada sequência. N indica N-terminal e C indica o C-terminal. 


A estrutura da ShK mostra 2 a-hélices curtas compreendendo os resíduos 14- 
19 e 21-24 conectada por alça (/00ps). A a-hélice N-terminal se estende por 8 resíduos 
interrompida por um volta (turn de inglês) formando 3  -helice (33,34). Já a BgK mostra 2 
a-hélices compreendendo as posições de 9-16 e de 24-31 (35) também conectadas por 
loops. Comparado a BgK com ShK a primeira a-hélice não está interrompida. A diferença 
na cadeia de aminoácidos entre a ShK e a Bgk está na inserção de 4 aminoácidos na Bgk, 
entre os aminoácidos das posições 16 e 19, e também a remoção de um aminoácido da 
BgkK na posição 30, em relação a ShK. As duas toxinas compartilham uma identidade de 
33% e possuem todas cisteínas conservadas. Seu alinhamento está apresentado na figura 
abaixo. 


10 = 30 
1 1 
KIA STIHL/1-35 "ee | j: PKS RRsA E. Za ERES E ; g 
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Figura 3: Alinhamento da sequência das toxinas ShK e BgkK. Os códigos correspondem as 


seguintes toxinas: K1A STIHL - Kappa-stichotoxin-She3a (Shk); K1B BUNGR - Kappa-actitoxin-Bgria 
(BgkK). Coloração está indicada segundo à matriz BLOSUM62. 





Não há folhas-B pregueadas antiparalelas nestas toxinas o que contrasta com 
as toxinas bloqueadoras de canais de potássio de escorpião que são CSap (cysteine 
stabilized a/B) (36). Exceto pela interrupção da a-hélice N-terminal, ShK e BgK adotam 
uma conformação muito similar, em que o N-terminal é mantido próximo ao C-terminal 
pela primeira ponte dissulfeto (ShK 3-35 e BgkK 2-37) enquanto que a terceira ponte 
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dissulfeto (ShK 17-32, BgK 20-34) aproxima os dois loops que interconectam os trechos 
a-hélice, puxando-se em direção ao centro molecular conferindo uma forma globular às 
toxinas. Existem em anêmonas do mar outras toxinas bloqueadoras de canais de potássio 
dependentes de voltagem (k-neurotoxinas) importantes denominadas k-neurotoxinas tipo Il 
((1)), que apresentam um domínio Kunitz-type (p.ex. APEKTx1 [P86862] ou a-dendrotoxin 
[P00980]). Existem também k-neurotoxinas (BDS) tipo 3 de anêmonas do mar (37) que 
apresentam um domínio B-defensina símile totalmente diferente formado exclusivamente 
por folhas-f pregueadas estabilizadas por 3 pontes dissulfeto. E por fim também existem 
as k-neurotoxinas de escorpião CSap (p.ex. charybdotoxin) que também tem 3 pontes 
dissulfeto (38), não é possível alinhar a sequência da ShK e da BgK com essas toxinas, 
pois a estrutura tridimensional é muito diferente entre estes domínios. 


Atualmente existe uma superfamília de proteínas cuja principal característica é a 
presença do domínio ShKT, em decorrência da sua alta similaridade com as toxinas ShkK 
e Bgk. Existem hoje descritas 21 toxinas de anêmonas com domínio ShKT. Não existem 
outras neurotoxinas com esse domínio em outros grupos animais exceto as toxinas do 
grupo CRISPs (Cysteine-rich secretory proteins) (39), que são formadas por dois domínios 
ou um domínio SCP seguido pelo ShKT. Além disso ao domínio ShkKT está presente em 
mais de 776 proteínas (35) listadas no UNIPROT incluindo não toxinas distribuídas entre 
diversas famílias (40) incluindo proteínas de adesão do tipo Cadherin-like, proteases e 
outras enzimas (p.ex Astacin-like metalllopeptidase M12A) ou modulando fluxos de cálcio 
via receptor de ryanodina (RyR) (40). Não se conhece o papel fisiológico do domínio ShkT 
ou se há uma possível relação com a regulação de canais de potássio na célula. 


É característica dessa família de k-neurotoxinas tipo | (Shk/Bgk) a presença de 
um par de aminoácidos geralmente aromático ou hidrofóbioco/pásico denominada díade 
funcional que nas k-neurotoixinas tipo | de anêmonas é formada pelos aminoácidos 
Lisina-Tirosina (KY), sendo essa díade responsável pela ação bloqueadora de canal de 
potássio dessas toxinas (35,41), embora atualmente seja conhecida a importância de 
outros aminoácidos da cadeia madura para a função bloqueadora não apenas do canal 
Kv1.3, mas também de outros canais.(1,42,43). Esse bloqueio funciona com a díade KY 
ocluindo a passagem de íons pelo poro do canal de potássio. A díade funcional está melhor 
representada na figura abaixo. 
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Figura 4: Díade funcional de toxinas bloqueadoras de canais de potássio dependentes de 
voltagem. A figura mostra o par de aminoácidos importantes para a oclusão do poro do canal presente 
em toxinas domínios com domínios estruturais diferentes. A figura mostra acima o nome da toxina e em 
baixo o domínio estrutural correspondente: ShK: Kappa-stichotoxin-She3a de Stichodactyla helianthus 

(P29187) domínio ShkKT. aDTX: alfa-dendrotoxina de Dendroaspis angusticeps (P00980) domínio 
Kunitz. ChTX: Charybdotoxin de Leiurus quinquestriatus hebraeus (P13487) scorpion short toxin CSa/p. 
As cisteinas participantes de pontes dissulfeto estão numeradas segundo a posição e as pontes são 
mostradas em verde. A estrutura secundária da proteína está indicada em vermelho, as alfa-hélices e 
em amarelo as folhas-beta pragueadas. O N-terminal (N) e o C-terminal (C) de cada cadeia também 
são indicadas. A díade funcional é mostrada pelo par de resíduos evidenciados em cada molécula 
numerados segundo sua posição na cadeia. 


O sitio de ligação para a família de canais de potássio dependente de voltagem 
(Kv1.x) da BgK de B. granulifera está bem estabelecido e diversos aminoácidos além da 
díade funcional contribuem para a constante de dissociação e para a seletividade: Kv1.1 
(Kd=6 nM), Kv1.2 (Kd=15 nM), Kv1.3 (Kd=10 nM) (44,45). Além da díade funcional alguns 
aminoácidos descriminam entre os canais Kv1.1, Kv.1.2 e Kv1.3 sendo que o núcleo de 
ligação essencial para o bloqueio do canal é composto pelos aminoácidos S23; K25, Y26 
que, portanto, inclui a díade funcional, como se pode ver na figura abaixo: 
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Figura 5: Sitio de ligação ao canal de potássio família Kv1.x da BgK. A figura mostra os 
aminoácidos da toxina que contribuem para a ligação e seletividade pelo canal de potássio. Os 
aminoácidos importantes para o bloqueio, incluindo a díade funcional e compartilhados pelos canais 
kKv1.3, Kv1.2 e Kv1.1 são mostrados em vermelho (S23; K25; Y26). Aminoácidos que contribuem 
exclusivamente para a ligação ao Kv1.3 são mostrados em rosa (KO7; L17; T22; R27). Resíduos 
compartilhados entre o Kv1.3 e Kv1.1 são mostrados em roxo (N19, Q24). Resíduos importantes para 
a ligação aos canis Kv1.3 e Kv1.2 são mostrados em laranja (F06 e H13) e por fim o aminoácido R12 
mostrado em amarelo só é importante para ligação ao Kv1.2. As pontes dissulfeto estão mostradas em 
verde. 


Os resíduos mais importantes da BgK para o bloqueio do 
canal Kvi.3 ordenados de acordo com a potência de bloqueio são: 
K25(1C,,>300)>F06(IC,,=167)>Y26(1C,,=100)>S23(IC,,=30)>H13(IC,,=20) segundo 
determinado por Dauplais (35). 

A ShK também usa um núcleo de resíduos similares à BgK mas alguns são 
específicos lembrando que as duas moléculas tem marcantes diferenças estruturais devido 
à inserção de resíduos extras na BgK após a posição 10. Os resíduos mais importantes 
para o bloqueio de Kv1.3 são KO7, L17, T22, R27 são importantes para ligação a Kv1.3 
(8,32) como mostrado na imagem abaixo: 
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Figura 6: Sitio de ligação da ShK ao canal Kv1.3. São mostrados os aminoácidos importantes 
para o bloqueio do canal I07, R11, S20, F27 em laranja e a díade funcional K22, Y23 é mostrada em 
vermelho. As pontes dissulfeto são mostradas em verde. 


Para o nosso trabalho demos ênfase apenas aos contigs que apresentaram um 
domínio ShkK único, tal como ocorre nas k-neurotoxinas do tipo |. Entretanto, este domínio 
é encontrado em diversas proteínas no reino animal, inclusive algumas toxinas, como é 
o caso das CRISPs, que constituem de um domínio CAP e outro domínio ShK. Casos de 
toxinas que apresentam outros domínios junto com a ShK serão discutidos em capítulos 
específicos (46).. 


Revisão Bibliográfica ELES 


MATERIAL E MÉTODOS 


ORIGEM DAS AMOSTRAS 


Os exemplares foram coletados em diferentes locais e datas. Os espécimes da 
Bunodosoma caissarum da costa de São Paulo foram coletados na latitude -23.72622967 
e longitude -45.41930974 em abril de 2014e os exemplares da Bunodosoma caissarum de 
origem do Arquipélago São Pedro e São Paulo foram coletadas na latitude 0.9168648 e 
longitude -29.34527083, no Oceano Atlântico, em agosto de 2007. 


PREPARO DO TECIDO 


O material utilizado para os experimentos foi o tecido dos tentáculos das anêmonas 
das duas populações, devido a sua maior concentração de nematocistos. Foi extraído 
cerca de 200mg de tecido, o qual foi embebido de RNA Later (Ambion, EUA) e armazenado 
em 4ºC por 24 horas. Após esse período foi dispensado o RNA Later e o material congelado 
em -20ºC e depois de 24 horas em -80ºC, de modo a se escalonar gradativamente a 
temperatura e tornar mais efetiva a preservação do tecido e evitar a formação de cristais 
intracelularmente, o que pode causar extravasamento de conteúdo citoplasmático e perda 
de ácidos nucléicos, como sugerido no manual do fabricante. 


EXTRAÇÃO DE RNA TOTAL 


Após o preparo inicial das amostras iniciamos o processo de extração de RNA dos 
tecidos através do protocolo que utiliza o TRizol (Invitrogen, EUA) como reagente, seguindo 
o protocolo padrão do fabricante. Foram utilizados 3 mL do reagente para os 200mg de 
tecido, que foi homogeneizado totalmente em um aparelho Polytron Homogenizer PT 3100, 
utilizando por volta de 10.000 rotações por minuto, por 1 minuto. Por fim o total extraído foi 
eluído em 50 yL de água e mensurado através de absorbância de 260nm e 280nm, em um 
microespectrofotômetro modelo Nanodrop (Thermo Fisher Scientific, EUA). 


CONSTRUÇÃO DAS BIBLIOTECAS DE cDNA 


Purificação do mRNA 


Para a extração de mRNA foi usado o kit Dynabeads (Life Technologies, 
EUA), usando o seu protocolo padrão para extração de mRNA a partir de RNA total. O 
protocolo consiste em adicionar esferas magnéticas (beads) que possuem cauda poli-T 
covalentemente ligadas, no qual o mRNA se ligará por complementaridade através do poli-A 
e será separado do meio por ação magnética. Após esse processo as esferas são lavadas 
duas vezes com o tampão de lavagem próprio do kit, sendo repetido o processo de atração 
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magnética das esferas em cada vez. Ao final é adicionado H20 Molecular Grade (Sigma) 
ao meio e em seguida aquecido à 65“C para a desnaturação do mRNA das sondas poli-T, 
o que possibilita que o mRNA seja recuperado junto com o sobrenadante e adicionado a 
outro tubo livre de RNAses. 


Preparo do mRNA 


O mRNA resultante foi mensurado através do método de absorbância de 260nm 
e 280nm e também por eletroforese automatizada e por eletroferograma pelo sistema 
Bioanalyzer 2100 (Agilent Technologies, EUA). As amostras foram armazenadas em -80ºC 
para uso posterior. O material a ser utilizado foi processado seguindo-se o protocolo 
recomendado pela Illumina (EUA), através do kit TruSeq RNA Sample Preparation (Ilumina, 
EUA). Para o preparo das amostras foi efetuada uma segunda purificação de mRNA das 
mesmas. O produto final contendo apenas o mRNA teve incorporado uma mistura de 
reagentes da fabricante que tem como função eluir, fragmentar e incorporar nos fragmentos 


de mRNA iniciadores aleatórios (random primers). 
Construção da biblioteca de cDNA 


Em seguida as amostras passaram pelo processo de síntese da primeira fita de 
cDNA pelo método de transcrição reversa, na qual os iniciadores amplificam a primeira 
fita de cDNA. A seguir realizamos o processo de síntese da segunda fita do cDNA, o que 
elimina o mRNA molde da síntese da primeira fita do cCDNA das amostras. O procedimento 
seguinte consiste em reparar as extremidades não coesivas que o cDNA apresenta. Isso 
permite a equalização do comprimento nas duas fitas do cDNA para logo a seguir ter 
incorporado no final 3' destas um nucleotídeo “A”, que tem como função prevenir que esses 
fragmentos de cDNA se liguem a outros durante a reação de ligação dos adaptadores, cujo 
objetivo é incorporar sequências de nucleotídeos pré-definidas no final dos fragmentos 
gerados. Esses adaptadores têm como objetivo criar identificadores para cada amostra, 
pois os cDNAs independentes de cada uma terão o seu adaptador definido, possibilitando 
que o sequenciamento seja realizado por multiplexação (multiplexing), aplicando diferentes 


amostras simultaneamente ao aparelho. 


Por fim os fragmentos de cDNA contendo os adaptadores são amplificados através 
da reação em cadeia da polimerase (PCR) contendo iniciadores que são específicos aos 
adaptadores, possibilitando um enriquecimento da quantidade total dos fragmentos. A 
qualidade das bibliotecas foi aferida pelo sistema de eletroforese capilar em Bioanalyzer 
(Agilent Technologies, EUA) e quantificação em PCR em tempo real (Kapa Sybr Library 
Quantification kit, KapaBiosystems). 
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SEQUENCIAMENTO 


Após a preparação das bibliotecas, os cDNAs são adicionados à célula de fluxo do 
aparelho (flow cell), onde ocorrerá o processo chamado agrupamento (clusterization), no 
qual cada fragmento é isotermicamente amplificado. Após a geração de grupos de cDNAs 
(cluster generation) ocorrerá o sequenciamento das amostras, na mesma célula de fluxo. Tal 
célula é uma placa que tem incorporado em toda a sua extensão dois tipos de adaptadores 
de nucleotídeos complementares aos adaptadores incluídos os fragmentos de cDNA. Os 
adaptadores incorporados aos fragmentos de cDNA são ligados por complementaridade 
a outros adaptadores que já se encontram na célula de fluxo. Quando as amostras são 
injetadas no sistema os fragmentos passam por um processo de desnaturação, separando 
suas duas fitas, o que possibilita que um dos adaptadores das cadeias possa se ligar aos 
adaptadores complementares da célula de fluxo, permitindo que através de uma reação em 
cadeia da polimerase possa criar uma fita complementar à fita original, incorporada a célula 
de fluxo. Terminando o processo de polimerização o fragmento passa por uma desnaturação 
e o molde original da fita é lavado e excluído do processo. Em seguida a fita ligada tem 
o seu outro adaptador, na sua outra extremidade, também ligado por complementaridade 
a outro adaptador na célula de fluxo, formando assim um tipo de ponte com o fragmento 
de cDNA, que passam por outro processo de amplificação por polimerização seguida de 
outra desnaturação, criando uma série de aglomerados de fragmentos semelhantes a si 
mesmos. A este processo de amplificação é dado o nome de amplificação em ponte (bridge 
amplification). 

O nosso sequenciamento utilizou-se do método de “paired-end”, o qual tem como 
objetivo sequenciar os dois sentidos da dupla fita do cDNA das amostras, para maior 
abrangência e segurança. O aparelho utilizado para o sequenciamento foi o HiSeg 1500 
(Ilumina, EUA) e a corrida foi realizada em 300 ciclos de 150 para cada fita, levando cerca 
de 72 horas para a sua finalização. 


Brevemente, após o agrupamento dos fragmentos começa o sequenciamento 
propriamente dito, que ocorre através da síntese da cadeia de DNA complementar à cadeia 
molde acoplada na célula de fluxo. O processo ocorre por inserção das quatro bases 
nucleotídicas (adenina, guanina, citosina e timina), sendo que cada uma delas é identificada 
por um marcador fluorescente que será excitado através de um laser. Com a fluorescência 
gerada o sistema consegue identificar qual base foi incorporada simultaneamente em cada 
um dos cDNAs gerados e agrupados na célula de fluxo, durante o sequenciamento. 
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PROCESSAMENTOS DO SEQUENCIAMENTO, MONTAGEM DAS LEITURAS E 
ANÁLISES COMPUTACIONAIS 


Processamento 


Finalizado o sequenciamento os dados brutos foram processados através de uma 
série de programas, cujo objetivo foi filtrar os dados brutos para que a montagem dos 
transcritos fosse executada apenas com reads de alta qualidade. Dando início às análises 
de bioinformática, os arquivos fastq foram gerados para cada amostra utilizado o software 
CASAVA (versão 1.8.2), contendo apenas sequências aprovadas no controle de qualidade 
de bases específico de índice Q maior que 30. Posteriormente foi utilizado um pipeline para 
análise das sequências, e pré-processamento dos dados brutos, com filtro das sequências 
por qualidade, tamanho da leitura, sequências com regiões de homopolímeros, e de baixa 
complexidade, caudas poli A/T/N e adaptadores, e pontas de baixa qualidade, com os 
softwares fastq-mcf, versão 1.04.662 e bowtie2, versão 2.2.5 (47). Os critérios empregados 
para a filtragem foram: regiões de homopolímeros e baixa complexidade acima de 90% 
da sequência foram eliminadas, e mantidas regiões com média de qualidade acima de 25, 
eliminando aquelas de baixa qualidade, e após a remoção das pontas de baixa qualidade, 
tamanho mínimo das sequências de 40 pares de bases. 


Montagem das leituras 


Após o pré-processamento e aplicação de filtros para obtenção de sequências de 
alta qualidade, iniciou-se a montagem feita através do pacote de programas chamado 
Trinity (versão: r20140413p1, de 13/04/2014). O Trinity é a ferramenta padrão para 
montagem De novo de sequências de transcriptomas que não tenham genoma de 
referência. Brevemente, o Trinity utiliza-se de uma combinação de três algoritmos para 
a sua função: Inchworm, Chrysalis e Butterfly. No primeiro passo, o Inchworm monta as 
leituras em sequencias únicas dos transcritos, usando um “algoritmo guloso” para tal. Esse 
algoritmo utiliza o algoritmo guloso, baseado no k-mer para uma montagem mais rápida e 
eficiente, utilizando apenas um único (melhor) representante, representando um conjunto 
de variantes, ou seja, o programa segue montando os transcritos seguindo as leituras que 
melhor se enquadram para a construção daquele transcrito dentro do k-mer estabelecido. 
Em seguida, o Chrysalis, a partir dos dados gerados no Inchworm, cria uma série de 
aglomerados de transcritos semelhantes entre si, para então utilizar o algoritmo de grafos 
de Bruijn para cada aglomerado, cada um refletindo a complexidade das repetições entre 
as variações das sequencias consenso. Por fim o Butterfly analisa os caminhos percorridos 
pelas leituras e o seu pareamento no contexto dos consensos para determinar quais 
sequencias são plausíveis. Através desse programa os dados obtidos foram agrupados em 
milhares de sequencias que se sobrepõe, formando sequencias contíguas. 


Nessa etapa foi definido que usaríamos os resultados do sequenciamento das 
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duas espécies de Bunodosoma caissarum como uma única espécie, pois é esperado que 
boa parte dos seus genes sejam compartilhados entre elas, sendo apenas alguns transcritos 
específicos, portanto o Trinity acaba por considerar transcritos com alta homologia entre as 
espécies como um único transcrito (contig). Não foi utilizado nenhum genoma de referência 
para a montagem. 


Análises computacionais 


Esses contigs foram analisados e anotados através de softwares do pacote 
Blastall, softwares esses que foram usados para fazer uma localização de sequencias 
que compartilham alguma similaridade entre o banco de dados escolhido e os contigs 
sequenciados. Como procedimento padrão fizemos uma busca local contra o banco de 
dados geral do NCBI (NR) e do Projeto de Anotação de Toxinas Animais, do Uniprot (http:// 
www.uniprot.org/program/Toxins). Para essas buscas utilizamos o critério de corte com 
“e-value” no valor de 1e-06, que estringe os resultados para sequencias mais similares às 
encontradas nos bancos de dados. O “e-value” é um parâmetro que descreve a chance de 
encontrarmos aleatoriamente resultados de uma busca de uma determinada sequência 
dentro de um banco de dados, ou seja, quanto menor o resultado desse valor menor a 
chance de ter ocorrido por coincidência. 


Resumidamente, as etapas da análise de expressão envolveram o mapeamento dos 
reads nas referências com bowtie2 (47), em seguida, a estimativa do nível de abundância 
foi feita a partir das contagens de leituras por transcrito, normalizando-se em função de 
seus tamanhos, gerando um índice de expressão FPKM (Fragments Per Kilobase of exo 
nmodel per Million mapped reads) com o programa RSEM (RNA-Seg by Expectation 
Maximization) que não requer um genoma de referência (Li e Dewey, 2011). A normalização 
do nível de expressão entre as amostras foi feita com o metodo TMM (Trimmed Mean of 
M-values) (48) e a análise de expressão diferencial par a par entre todas as amostras foi 
feita com o software edgeR (49). Para estudar os padrões de expressão dos transcritos 
entre as amostras, foram utilizados os transcritos diferencialmente expressos normalizados 
obtidos com edgeR, que apresentaram diferença de intensidade de expressão entre cada 
par de amostras de pelo menos 4x mais, com significância estatística corrigida para falsa 
descoberta de p=0.001. 


A fim de minerarmos a maior quantidade possível de informações sobre as 
sequencias por nós obtidas efetuamos um “BLAST” contra todas as toxinas conhecidas 
de anêmonas do mar, usando os mesmos parâmetros utilizado no “BLAST” contra o banco 
NR do NCBl e o Uniprot. Para tal criamos um banco de dados contendo todas as toxinas 
anotadas do filo cnidária presentes no Uniprot para a execução do algoritmo. 


O último BLAST que fizemos foi contra famílias individuais de toxinas, famílias essas 


selecionadas conforme a sua importância segundo nosso conhecimento atual em toxinas 
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de cnidários e outros animais, para com isso maximizar a eficiência da nossa mineração de 


dados contra nosso sequenciamento. 
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RESULTADOS E DISCUSSÃO 


EXTRAÇÃO DE RNA 

A seguir apresentamos a tabela com os resultados da extração de RNA total 
correspondentes aos 200mg de tecido dos tentáculos das anêmonas. O RNA total obtido 
foi diluído em 50y! de água livre de RNAses. 











População Concentração de RNA (ng/ul) |Abs260/280 
Bcs-SP 1623 2,03 
Bcs-Ag 1560 1,95 











Tabela 1: Resultados da absorbância do RNA total em comprimentos de ondas de 260 e 280nm. 


A Coluna Concentração de RNA mostra os valores obtidos na extração em valores 
de ng por gl. Abs 260/280 indica o cálculo efetuado para estimar a possível contaminação 
por proteínas no RNA total extraído do tecido das anêmonas através da absorbância de luz 
no comprimento de onda de 260nm e 280nm. 

Nossa extração de RNA total conseguiu um total de 1,6 ug/yl para a população 
Bcs-SP e 1,5 ug/ul para a população Bcs-Aq, consideramos valores ideais para a seguinte 
purificação do mRNA do RNA total. Os valores de 2,03 para Bcs-SP e 1,95 para Bcs-Aq nos 
valores de absorbância 260/280 indica que conseguimos extrair RNA puro das anêmonas, 
sem contaminação de DNA ou proteínas. 


PURIFICAÇÃO DO MRNA 


Abaixo segue a tabela com os resultados da purificação de mRNA, mensurados pelo 
método de absorbância em comprimentos de ondas de 260 e 280nm: 











Espécie Concentração de mRNA (ng/ul) |Volume final (ul) |Quantidade final (ng) 
Bcs-SP 40,7 50 2035 
Bcs-Aq 36,4 50 1820 














Tabela 2: Resultados da purificação do mRNA, mensurados por absorbância de ondas 260nm e 280nm 


A Coluna Concentração de RNA mostra os valores obtidos na extração em valores 
de ng por gl. Volume final representa o volume em que o material foi diluído. Quantidade 
final é o quanto de material purificado foi conseguido, em ng. 


Também utilizamos da eletroforese automatizada, feita pelo aparelho Bioanalyser 
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(Agilent Technologies, EUA), para validação dos resultados da nossa purificação de mRNA 
das amostras. Para tal foi utilizado o “chip” próprio do sistema para RNA. Através desse 
procedimento pudermos verificar a distribuição dos fragmentos de mRNA conforme a sua 
faixa de peso molecular. A imagem abaixo é o resultado da eletroforese automatizada do 
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Figura 7: Imagem do resultado da eletroforese automatizada do RNA mensageiro das 2 amostras 
das populações de Bunodosoma caissarum. O marcador (ladder) para o “chip” especifico do 
aparelho para RNA contém fragmentos de tamanho de 500, 1000, 2000 e 4000 pares de bases. A linha 
verde representa a normalização do sistema para o Ladder, Bcs-SP e Bcs-Aq em fragmentos de 25 
bases. 
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Na figura 7 podemos observar que na amostra da população do litoral de São Paulo 
obtivemos maior concentração de fragmentos entre 1500 e 2100 de bases de mRNA, 
enquanto que na população do arquipélago obtivemos maior concentração de fragmentos 
por volta de 1400 e 1800 bases de mRNA. Valores levemente menores para a Bcs-Aq mas 
ainda assim os resultados são consistentes entre as populações. 


Para melhor visualização da distribuição dos fragmentos no mRNA obtido das 
populações e sua qualidade fizemos um eletroferograma do material, cujo resultado se 
encontra abaixo. 


1 Bcs-SP 





25 4000 [nt] 


Figura 8: Eletroferograma das amostras de mRNA. FU, em vermelho é uma sigla para Fluorescent 
Units, unidades de fluorescência utilizadas pelo sistema. As linhas em magenta simbolizam a área 
delimitada pela quantidade de contaminação de rRNA na amostra de mRNA. A numeração no eixo 

inferior representa o número de bases nucleotídicas dos fragmentos. Os detalhes em magenta 

das imagens representam linhas, nas quais as áreas delimitadas pelas mesmas correspondem 

a contaminação de RNA ribossomal ainda presente nas amostras. O número 1 indica o gráfico 
correspondente a população Bcs-SP e o número 2 corresponde a população Bcs-Aq. 
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Na figura apresentada do eletroferograma observamos uma área magenta maior na 
Bcs-Aq, enquanto que na amostra Bcs-SP o tamanho dessa área magenta foi praticamente 
inexistente. Isso demonstra que a amostra que representa maior nível de contaminação 
com o rRNA foi Bcs-Aq. 


SÍNTESE DO CDNA E VALIDAÇÃO DAS BIBLIOTECAS 


O passo seguinte do trabalho foi fazer uma nova purificação do mRNA das 
amostras, seguindo o protocolo da Illumina, e a construção da biblioteca de cDNA para o 
sequenciamento. Após a construção da biblioteca foi feito uma nova validação pelo sistema 
de eletroforese automatizada (Figura 9) e eletroferograma (Figuras 10), com a diferença 
que para esse procedimento utilizamos o “chip” para DNA do aparelho Bioanalyser (Agilent 
Technologies, EUA). 
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Figura 9: Imagem do resultado da eletroforese automatizada da biblioteca de cDNA das 2 
amostras das populações de Bunodosoma caissarum. O marcador (ladder) para o “chip” especifico 
do aparelho para DNA contém fragmentos de tamanhos entre 50, 7000 ses. A numeração verde na 
base representa fragmentos de 35 pares de bases incorporado às amostras, para fins de normalização 
dos fragmentos, assim como a numeração roxa representa fragmentos de 10380 pares de bases 
incorporado às amostras, para fins de normalização. 


Na figura 9 podemos observar que os picos de fragmentos nas duas amostras 
ficaram semelhantes entre si, com a maior concentração de fragmentos variando na faixa 
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entre 400 e 500 pares de bases, demonstrando a eficiência na construção da biblioteca de 
cDNA para o sequenciamento. Também é possível constatar uma maior concentração de 
fragmentos menores na Bcs-Aq do que em comparação a Bcs-SP, o que não inviabiliza o 


sequenciamento das amostras. 


1 Bcs-Sp 
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Figura 10: Eletroferograma das bibliotecas de cDNA das amostras. FU é sigla para Fluorescent 
Units e bp para pares de bases. Os números acima das curvas mostram os tamanhos em pares 
de bases dos fragmentos de cDNA. O pico verde na base representa fragmentos de 35 pares de 

bases incorporado às amostras, para fins de normalização dos fragmentos, assim como o ultimo pico 
representa fragmentos de 10380 pares de bases incorporado às amostras, para fins de normalização. 


No eletroferograma confirmamos o que observado na eletroforese automatizada 
apresentado na figura n, com a maior parte dos fragmentos de cDNA presentes na faixa 
de 400 e 500 pares de bases nas duas populações de BCS-Sp e entre 300 e 400 pares de 
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bases na população Bcs-Aq. 


SEQUENCIAMENTO 


Após a construção das bibliotecas o material foi sequenciado no aparelho Illumina 


Hi-Seq 1500, processo que demorou 72 horas. Com o sequenciamento finalizado os dados 


brutos gerados foram convertidos na forma de arquivos com a extensão “fastq”. Tal tipo 


de extensão fastq é um formato de conversão de dados gerados pelos sequenciamentos 


efetuados pelo sistema Illumina"” e que é lido pela maioria dos algoritmos de análise e 


processamento de dados gerados por plataformas de sequenciamento de nova geração. 


Na tabela 3 apresentamos os resultados iniciais do sequenciamento, com o valor total de 


leituras obtidas em cada amostra e os valores dos dados que foram filtrados pelo pré- 


processamento dos mesmos: 
























































Bcs-SP Resultados Yo 
Leituras totais 120,537,468 100 
Total das leituras boas 117,224,693 97.25 
Total das leituras filtradas 3,312,775 2.15 
* Leitura muito curta 2,816,563 2.34 
* Filtrada na qualidade 451,625 0.37 
* Filtrada no homopolimero 42,545 0.04 
* Filtrada na baixa complexidade 2,042 0.00 
Leituras aparadas 14,143,715 11.73 
Bcs-Aq 

Leituras totais 44,790,462 100 
Total das leituras boas 43,914,424 98.04 
Total das leituras filtradas 876,038 1.96 
* Leitura muito curta 732,191 1.63 
* Filtrada na qualidade 119,315 0.27 
* Filtrada no homopolimero 23,181 0.05 
* Filtrada na baixa complexidade 1,351 0.00 
Leituras aparadas 4,326,737 9.66 








Tabela 3: Resultados iniciais do sequenciamento das amostras 


O total das leituras foi o total de leitura que foram obtidas no sequenciamento das 


populações de Bunodosoma caissarum. Desse total foram excluídas as leituras que não 


cumpriram o mínimo esperado de qualidade. Leituras muito curtas: leituras filtradas devido 


ao seu tamanho reduzido. Filtrada na qualidade: leituras que tiveram baixa qualidade no 
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sinal durante o sequenciamento. Filtrada no homopolímero: leituras que foram filtradas 
por causa da presença predominante de homopolímero na sua sequência. Filtrada na 
baixa complexidade: leituras filtradas devido à baixa complexidade das suas bases 
nucletídicas, como predominância de repetições ao longo de toda leitura. As leituras 
aparadas foram aquelas que tiveram diferenças no tamanho das leituras forward e reverse 
no sequenciamento, sendo assim necessária o procedimento de aparar as pontas para que 
tenham leituras compatíveis no tamanho. 


Conforme visto na tabela anterior conseguimos uma grande quantidade de leituras 
boas em relação ao número de leituras totais, onde tivemos um aproveitamento de mais de 
97% em cada amostra. Porém é importante destacar que embora as amostras tenham sido 
preparadas de formas idênticas em todo o protocolo os números dos resultados de leituras 
totais nas duas populações possuem grande diferença, por volta de 3 vezes mais leituras 
para a Bcs-SP do que em comparação a Bcs-Aqg, mas a qualidade das leituras aproveitadas 
foi muito similar, por volta de 98%. Isso pode ocorrer devido a qualidade do mRNA que foi 
purificado das amostras, p.ex. a amostra de RNA de Bcs-Aq apresenta maior conteúdo de 
rRNA. O RNA é muito susceptível a degradações pela sua própria característica de fita 
simples mesmo estando embebido em solução preservante de RNAlater (Ambion, EUA). 
Ademais, a amostra Bcs-Aq foi obtida a partir de tecidos que estavam preservados desde 
2007, sendo suscetível a degradação ao longo do tempo. 


Após essa filtragem inicial das leituras obtidas no sequenciamento os dados foram 
processados no software Trinity, cujos detalhes do seu funcionamento se encontram no 


Material e Métodos (item 3.6.2). Os resultados dessa montagem se encontra na tabela 4 








a seguir. 
Leituras Transcritos Genes Tamanho médio Ribossomal 
161.139.117 199.517 124.790 950,22 13 

















Tabela 4: Estatística preliminar da montagem das leituras do sequenciamento pelo pacote Trinity. As 
duas populações foram consideradas como uma única população 


A coluna Leituras corresponde ao total de leituras que foi processado pelo Trinity. 
Transcritos foi o total de sequencias que o programa conseguiu montar. Genes é o número 
de genes individuais que o software conseguiu identificar. Tamanho médio representa o 
tamanho médio de todos os transcritos montados. Ribossomal é a quantidade de transcritos 
ribossomais identificados após a montagem. 


Na tabela 4 a seguir estão os resultados da montagem do sequenciamento do 
mRNA das anêmonas, que foi feito com o programa Trinity, detalhes do seu funcionamento 
se encontram no Material e Métodos. Nessa parte do processamento as duas populações 
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de BCS do litoral sudeste de São Paulo e a do arquipélago foram consideradas como 
uma, para fins de análises, já que como as duas populações são da mesma espécie então 
esperávamos encontrar grande parte do seu transcriptoma idêntico entre si, portanto seria 
mais sensato considerar as duas populações como uma única amostra. Em uma etapa 
posterior das análises será feito um levantamento da expressão gênica de cada transcrito 
identificado nas amostras e, com isso, teremos os contíguos expressos diferentemente em 
cada dado amostral da espécie Bunodosoma caissarum: 


A quantidade de transcritos que o programa Trinity resultou para as duas populações 
foi de quase 200 mil. Mas é observado uma diferença na contagem entre as colunas de 
transcritos e genes. Essa diferença ocorre porque o programa identifica em suas análises 
que alguns genes possuem diferentes isoformas entre si, ou seja, são sequências 
semelhantes entre si que o algoritmo classifica como sendo um mesmo gene, mas em 
diferentes isoformas. 


Na coluna Ribossomal temos a informação de 13 genes ribossomais identificados 
após a montagem das leituras. Isso demonstra que mesmo após nosso procedimento de 
purificação do mRNA, afim de excluirmos todo o restante do material gênico ainda ficamos 


com transcritos ribossomais na nossa amostra. 


ANÁLISE DO SEQUENCIAMENTO 


O passo seguinte do trabalho foi analisar nossas sequencias em busca por 
similaridades em bancos de dados com informações proteicas, tanto de componentes 
celulares quanto de toxinas. Nossa primeira opção foi o banco de dados de proteínas Non- 
Reduntant (NR), do NCBI, que inclui dados dos bancos GenBank, PDB, SwissProt, PIR 
e PRF. Essa busca foi feita através do software BLAST, como detalhado no Material e 
Métodos. Nessa parte do trabalho as análises de expressão das sequencias adquiridas 
foram separadas entre as duas populações. Esse método de montagem como uma única 
população e analisar a expressão de cada sequencias entre as duas populações permite 
identificarmos os transcritos comuns entre as populações, com as diferentes expressões 
entre elas. Essa primeira análise gerou a tabela abaixo. 
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Categorias Contigs FPKM Bcs-SP | % Bcs-SP | FPKM Bcs-Aq % Bcs-Aq 
Toxinas 315 14756,52 1,63 57966,98 4,65 
Não-caracterizadas | 912 2567,1 0,28 4434,96 0,36 
Preditas 43098 242548,63 26,77 2538083,7 20,37 
Sem resultado 134010 542761,28 59,91 809432,21 64,97 
Celulares 13872 74868,12 8,26 80157,07 6,43 
Hipotéticas 7310 28525,81 3,15 40151,23 3,22 
Total 199517 906027,46 100 1245946,15 100 




















Tabela 5. Resultados do BLAST contra os transcritos, divididos em diferentes categorias. 


As categorias estão divididas entre: Toxinas — as possíveis toxinas; Não- 
caracterizadas — proteínas identificadas presentes no banco de dados, mas sem 
caracterização; Preditas — proteínas preditas, sem maiores informações; Sem resultado 
— transcritos que não tiveram resultado no BLAST; Celulares — transcritos identificados 
como possíveis proteínas celulares. Hipotéticas — proteínas anotadas como hipotéticas 
nos bancos de dados. Coluna Contigs mostra a quantidade de transcritos identificado 
em cada categoria. FPKM Bcs-SP representa o nível de expressão de cada categoria na 
população Bcs-SP, segundo o método FPKM. % Bcs-SP representa o nível de expressão 
de cada categoria para a população Bcs-SP, em porcentagem. FPKM Bcs-Aq representa o 
nível de expressão de cada categoria na população Bes-Aq, segundo o método FPKM. % 
Bcs-Aq representa o nível de expressão de cada categoria para a população Bcs-Aq, em 
porcentagem. FPKM é a sigla paraFragmentsPerKilobaseoftranscriptper Million. 


Um detalhe importante que foi identificado nessa primeira análise foi a diferença 
de expressão entre as duas populações, principalmente nas toxinas, onde tivemos uma 
diferença 3 vezes maior para a população do Arquipélago. Tal diferença pode ter ocorrido 
por causa da qualidade do material sequenciado da Bcs-Aqg, que estava mais degradado 
do que em relação à Bcs-SP, ou simplesmente a diferença seja real, já que a população 
do Arquipélago está completamente isolada e isso pode ter influenciado a expressão dos 


transcritos. 


Na tabela a maior porcentagem de expressão identificada nas duas populações 
foi da categoria “Sem resultado”, que significa que esses contigs não possuem resultado 
identificado em bancos de dados. Esse fato é explicado pelo fato que esses animais são 
poucos estudados, então consideramos normal não encontrarmos muitas informações 
sobre seus dados gênicos. 


Os transcritos dentro da categoria Celulares foram aqueles que tiveram como 
resultado no BLAST proteínas que são conhecidas sua função não-tóxica no organismo de 
eucariotos. Essa categoria teve um total de 8,26% de expressão para a Bcs-SP e 6,43% 
para a Bcs-Aq, porém como grande parte da anotação dos nossos contigs se encontram na 
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categoria “Sem resultado”, “Não caracterizadas”, “Preditas” e “Hipotéticas”, esse número 


pode não representar a real expressão nesses animais enquanto vivos. 


Na categoria “Toxinas” obtivemos apenas 315 contigs identificados como toxinas, 
com um total de 1,63% de expressão na Bcs-SP e 4,65% de expressão na Bcs-Aqg. 
Esses valores foram significantemente pequenos em relação ao todo transcriptoma das 
anêmonas, talvez não representando um valor real da expressão de toxinas dos animais. 
Por isso decidimos fazer uma mineração dos dados, afim de extrairmos o máximo possível 


de informações de transcritos similares à toxinas. 


Para essa mineração criamos um banco de dados pessoal, contendo todas as 
toxinas revisadas existentes no banco de dados do Uniprot, mais precisamente do Animal 
toxin annotation project. Esse banco foi escolhido pois se trata de um programa de anotação 
especifico para a anotação de toxinas. Nesse banco estão presentes toxinas de vários 
animais diferentes, como serpentes, aranhas, escorpiões, anêmonas do mar, caramujos 
e etc. Todos os dados presentes foram curados por revisores não-automatizados, o que 
aumenta sua credibilidade. 


Como resultado do BLAST das nossas sequencias contra o banco de dados de 
toxinas do Uniprot obtivemos 3613 possíveis toxinas. Um resultado significativamente 
superior do que o obtido anteriormente, apenas com o resultado do BLAST contra o banco 
de dados NR, NCBI. Porém como forma de confirmarmos nossos resultados decidimos 
fazer um último BLAST, contra todas toxinas conhecidas de cnidários depositados no 
banco de dados Uniprot. Essa análise gerou um total de 30 sequencias com similaridade 
com toxinas de cnidários que não tínhamos identificado anteriormente. Esse resultado nos 
causou estranheza, já que achávamos que com o BLAST contra todas toxinas depositadas 
usando os mesmos parâmetros já conseguiríamos recuperar todas as toxinas possíveis, O 


que não se mostrou verdadeiro. 


Embora essas sequencias adicionais que identificamos com o BLAST contra toxinas 
de cnidários tenha causado certo espanto, não foi algo que ilógico, pois o algoritmo do 
BLAST trabalha com buscas por similaridades em bancos de dados, portanto quanto menor 
o banco maior sua similaridade. Já que o banco contendo apenas toxinas de cnidários (com 
255 toxinas) seja menor que o banco total de toxinas (com 6622 toxinas), a similaridade 
será bem melhor para o BLAST contendo apenas toxinas de cnidários. 


Já que foi possível encontrar mais similares nas nossas sequencias à toxinas que 
passariam despercebidos com um BLAST contra um banco contendo apenas toxinas de 
cnidários nós decidimos fazer análises com cada família de toxina do nosso interesse 
contra nossas sequencias. Essas toxinas que escolhemos para esses BLASTs individuais 
foram todas as famílias conhecidas em cnidários e também foram escolhidas toxinas com 


base em trabalhos publicados recentemente sobre possíveis novas toxinas. 
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Obtivemos um total de 308 novas sequencias similares a toxinas nessa nova análise, 
demonstrando quantas possíveis toxinas iriam ser ignoradas no nosso trabalho, ficando 
com um total de 3951 sequencias. Porém, percebemos que nosso trabalho poderia ter uma 
grande quantidade de falsos positivos, pois muitas proteínas já conhecidas e não sendo 
toxinas possuem domínios em sua constituição que compartilham características com 
toxinas, como é o caso do domínio ShkKT, que foi primeiro descoberto na toxina ShkK (30), 
da Stichodactyla helianthus, e que também está presente em proteínas em praticamente 


todos seres vivos. 


Pararesolver esse problema verificamos cada sequência individualmente, analisando 
quais domínios estavam presentes em sua constituição e quais características eram 
normais apenas em toxinas, esperando assim separar quais sequencias eram proteínas 
não-tóxicas e as quais estavam mais próximas de possíveis toxinas. Desse procedimento 
resultou a figura abaixo, representando a expressão de cada família identificada perante o 


total expresso como toxina. 
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Comparativo da Expressão entre as populações 


Figura 11: Famílias de toxinas expressas nas duas populações e seu nível de expressão. 
As siglas em ordem alfabética representam as seguintes famílias de toxinas: ACES: Venom 
Acetylcholinesterase ; ACPH - Venom acid phosphatase; ACR1 - Acrorhagin-1; ACR2 - Acrorhagin-2; 
ACPS - Actinoporin (Sea Anemone); ACTC - Actinoporin (Conoidea); AETX — AETX; AUGR — 
Augerpeptide; AVIT — AVIT; CF1K - Cf1 (Possible Knottin); CONO - Conotoxin O2 (ICK-LIKE); CONP 
- Conopeptide P-like (kazal type); CRIS — CRISP; CTX - Cytolisin (jellyfish toxin); DPP - PLA2; EGFL 
- EGF-Like; EGFT - EGF Toxin; FAR — FARP; ICKL - ICK-like (BgrTx1); JIIB - Possible new Toxins 
(Jiibo3); KV1A - Sea anemone Type ta Kv (ShkK-Like); KV1B - Sea anemone Type 1b Kv (Bgk-like); 
Kv5 - Sea anemone Kv Type 5 (ICK-like); KVBDS3 - Sea anemone B-defensin (Kv type 3); LCTA - 
Latrotoxin Superfamily; LECM - Lectin/C-Type; MACF - MACPF; NATT - Natterin (Aerolysin-Like); 
NAVT1 - Sea anemone B-defensin (Nav type |); NAVT2 - Sea anemone B-defensin (Nav type Il); 
NWTX - Possible new Toxins (Av1931/Bcs1802); OXLA - L-amino-acid oxidase; PA1 — Lipase/PLA!; 
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PA2 - PLA2; PD10 - Peptidase S10; PLB — PLB-Like; SCR - SCRiP; STX3 - Sea anemone Short toxin 
Type 3; SVKT2 - Sea Anemone Kunitz Type 2 Kv Toxin; SWAP - Waprin-Like; TCTP - TCTP Family; 
TX8 - Sea anemone 8 toxin family; TX9 - Sea anemone structural class 9a Family; VKT2 - Kunitz-type 
Family; VM2 - Peptidase M12B (PII); VM1 - Peptidase M12B (PI); VM3 - Peptidase M12B (PIII); VMPA - 
Peptidase M12A (Astacin-like); VSP1 - Peptidase 81. 


No gráfico acima temos uma visão geral das toxinas encontradas e a sua expressão 
nas duas populações, em porcentagem. Vemos que a possível toxina mais expressa nas 
populações é a Sea anemone 8 toxin Family, que não possui função definida e que só tinha 
sido encontrada na anêmona Anemonia viridis. As famílias que também são bem expressas 
pertencem as famílias de toxinas de cnidários clássicas, como as toxinas bloqueadoras de 
canais de potássio e sódio. As famílias mais conhecidas serão discutidas posteriormente 
no trabalho, em capítulos específicos para cada uma. 

O último passo para finalizarmos a análise geral do transcriptoma foi acrescentarmos 
as novas sequencias identificadas através dos BLASTs individuais como possíveis toxinas 
a tabela total das duas populações. Assim esperamos termos nos aproximado mais da 
porcentagem real de toxinas e outros transcritos que são expressos pelas duas populações 
de Bcs. Segue abaixo os dois gráficos correspondentes à essa análise. 
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Figura 12: Gráfico do total de expressão nas duas populações de Bunodosoma caissarum. O 
gráfico 1 representa a população Bcs-SP e o gráfico 2 representa a população Bcs-Aqg. Em azul está 
a fatia das sequencias que não tiveram similaridades identificadas (No Hit). Na fatia laranja estão as 
sequencias similares a proteínas celulares (Cell). Cinza são as sequencias que foram preditas em 
possíveis proteínas (Predicted). As proteínas hipotéticas estão em amarelo (Hypothetical). Em verde as 
não caracterizadas (Uncharacterized). A fatia em vermelho são as sequencias que foram identificadas 
como possíveis toxinas (Tox). O BLAST foi feito com o banco de dados NR, do Genbank. 
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Com as análises finalizadas dos BLASTs específicos para diferentes classes de 
toxinas conseguimos enriquecer o total expresso de toxinas perante o toda a expressão 
das populações, passando de 1,63% para 3% expresso na Bcs-SP e 4,65% para 8% de 
expressão na Bcs-Aq, praticamente o dobro nas duas populações, mostrando a efetividade 
do nosso método de mineração de dados com BLASTSs individuais. 


ANÁLISE DOS TRANSCRITOS SIMILARES A ACTINOPORINAS 


Foram encontrados doze contigs com similaridade com citolisinas pertencentes à 
família das actinoporinas conforme mostrado na tabela abaixo. 


; . E : ; Actinoporinas 
Contig ID Acerto no Blast: Identificador (Acession code) (subfamilias) 
c28100 91 ACTP2 ACTEQ: Equinatoxin Il de Actinia equina 9.09E-50 Retiniatio 

(P61914) 
: ACTP5 ACTEQ: DELTA-actitoxin-Aeg1b de Actinia ; als gi 
c61681 gt. ii equina (Q93109) 3.71E-118 | Actiniaria 


: ACTP5 ACTEQ: DELTA-actitoxin-Aeg1b de Actinia : ala sã 
c64268 g1. ii equina (Q93109) 1.91E-111 | Actiniaria 


a ACTP4 ACTEQ: DELTA-actitoxin-Aegic de Actinia r ear 
c64268 g1 i2 equina (Q9Y1U9) 3.93E-119 | Actiniaria 


c64268 91. ia ACTP5 ACTEQ: DELTA-actitoxin-Aeg1b de Actinia 3.07E-410 | Actiniaria 


equina (Q93109) 
; ACTP5 ACTEQ: DELTA-actitoxin-Aeg1b de Actinia . iniari 
c64268 91. i4 equina (Q93109) 1.63E-103 | Actiniaria 
c123467 91H ONG Tereporin-Ca1 de Cinguloterebra anilis 1.24E-07 Conóidoa 


(incompleto) (PODN66) 


c60312 g2 i2 | ACTP1 CINAN: Tereporin-Cal de Cinguloterebra anilis ; E 
(incompleto) (PODN66) ad Conoidea 


c60312 92 i3 ACTP1 CINAN: Tereporin-Cal de Cinguloterebra anilis 1.72E-07 Canoidá 
(PODN66) 

: ACTP2 MONPT: Echotoxin-2 de Monoplex ; RR 
c64761 92 à2 parthenopeus (Q76CAS) 9.57E-07 Actiniaria 
c94977 g1.il ACTPC ACTTE: DELTA-actitoxin-Ateta de Actinia 7 hasta di 
(incompleto) | tenebrosa (P61915) RR | inata 


Tabela 6: Actinoporinas de Bunodosoma caissarum. 


c83042 g1.il ACTP1. CINAN: Tereporin-Cai1 de Cinguloterebra anilis 1.13E-09 Conóidiá 


A tabela mostra os contigs identificados na biblioteca de B. caissarum com 
similaridade com Actinoporinas das subfamílias de anêmona do mar e de moluscos 
indicando os respectivos E-values e os números de acesso do UNIPROT. Dois contigs 


representam sequencias parciais e não foram utilizadas na figura do alinhamento. 
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Os contigs classificados como pertencentes às actinoporinas da subfamília actiniaria 
apresentaram uma organização similar, contendo regiões 5'UTR, seguida pela região 
codificante e 3ºUTR, variando em tamanhos de 999 a 1656 nucleotídeos. A maioria destas 
sequências apresentou sinais de poliadenilação clássicos (AATAAA) no final da região 
3'UTR. Entretanto, o contig c94977 g1 il está incompleto. Ainda assim, este contig tem 
74% de similaridade (calculada pelo EMBOSS Neddle) com a região C-terminal de DELTA- 
actitoxin-Ateta de Actinia tenebrosa (P61915) sendo claramente uma actinoporina. 


Para melhor entender as relações de similaridade das sequências identificadas 
foi feito um alinhamento dos contigs completos com os seus respectivos acertos (hits) 
encontrados pelo BLAST e com algumas actinoporinas cuja estrutura tridimensional e 
dados funcionais são bem conhecidos, o que permitiu construir um dendrograma mostrado 
na figura abaixo: 
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Figura 13: Dendrograma dos contigs similares às toxinas da família das Actinoporinas. O 
dendrograma foi montado por neighbour joining utlizando um modelo de substituição JTT de acordo 
com um alinhamento feito por Muscle. A árvore mostra em vermelho sequencias de actinoporinas 
da subfamília actiniaria: ACTP2 ACTEQ: DELTA-actitoxin-Aegia (Equinatoxin Il) de Actinia equina 
(P61914). ACTPC ACTTE: DELTA-actitoxin-Ateta (Tenebrosin-C) de Actinia tenebrosa (P61915). 
ACTP4 ACTEQ: DELTA-actitoxin-Aegic de Actinia equina (Q9Y1U9). ACTPC ACTFR: DELTA- 
actitoxin-Afria (Fragaceatoxin C) Actinia fragacea (B9W5G6). ACTP5 ACTEQ: DELTA-actitoxin-Aegib 
de Actinia equina (Q93109). ACTP1. STIHL: DELTA-stichotoxin-She4a (Sticholysin |) de Stichodactyla 
helianthus (P81662). Em azul sequencias da subfamília conoidea: ACTP2. MONPT: Echotoxin-2 de 
Monoplex parthenopeus (Q76CA2). ACTP CONCN: Conoporin-Cn1 de Conus consors (PODKQ8). 
ACTP1 CINAN: Tereporin-Ca1 de Cinguloterebra anilis (PODN66). Em roxo claro se destaca um grupo 
de contigs que tiveram similaridade com sequencias da subfamília conoidea. Os contigs incompletos 
estão indicados por asterisco. Os números indicam os valores de bootstrap de 500 replicatas. 
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Sete contigs (28100 g1 i1;c61681 g1 if; c64268 g1 ite suas isoformas; i2;i3 e 
i4) foram mais similares com sequências pertencentes à subfamília actiniaria. Os melhores 
E-values foram com dois precursores de equinatoxinas de Actinia equina: ACTP4 ACTEQ: 
DELTA-actitoxin-Aeqic (Q9Y1U9) com o qual o contig c64268 g1 iZ2 mostrou 89.3% de 
similaridade e ACTP5 ACTEQ: DELTA-acititoxin-Aeg tb (Q93109) com o qual o c61681. 
g1 if mostrou 89.4% de similaridade. De forma geral todos os contigs pertencentes à 
família Actiniaria tem similaridades acima de 80%. 


Todos os contigs mostrados em vermelho no dendrograma, exceto o contig parcial 
c94977 91 il, apresentaram ORFs completos com start e stop códons, codificando 
precursores variando em tamanho de 212 a 215 aminoácidos e peptídeos sinais de 19 
aminoácidos foram identificados pelo SignalP, como está mostrado no alinhamento da 
figura 03. Seguidos por um pró-peptídeo contendo a sequência de endereçamento para 
o nematocisto indicando claramente o ponto de clivagem da toxina madura. Algumas 
sequencias apresentam uma substituição conservativa na díade de clivagem com KK no 
lugar de KR, ver figura 08. 


No dendrograma o contig c28100 91. if foi o mais divergente entre as sequências 
pertencentes às actinoporinas da subfamília actiniaria. Este contig apresenta também 
um start códon e um stop códon, além de um sinal de poliadenilação ao fim da região 
3'UTR, mas codifica um precursor maior com 244 aminoácidos. Entre o peptídeo sinal e a 
região madura há uma grande inserção no lugar do pró-peptídeo e a sequência consenso 
(DEDEDIEKR) não é claramente identificada, ver figura 9 abaixo. Entretanto, este possível 
pró-peptídeo também apresenta inúmeros aminoácidos negativos e um sítio de clivagem 
KR a partir da posição 74 predizendo uma região da toxina madura um pouco menor com 
170 aminoácidos que apresenta 64.2% de similaridade com a toxina madura de ACTP2 
ACTEQ: Equinatoxin Il de Actinia equina (P61914) ou 65.9% de similaridade com ACTP1 
STIHL: DELTA-stichotoxin-She4a (Sticholysin |) de Stichodactyla helianthus (P81662). 


Apesar de esse precursor ser o maior, com 244 aminoácidos, em compensação a 
parte da toxina madura é 9 resíduos menor que as outras actinoporinas, que tem em geral 
179 aminoácidos. 


É possível observar no alinhamento da figura 9 que a maioria dos sítios para ligação 
fosfocolina, a região de interação inicial rica em aromáticos outros sítios importantes como 
o de adesão elular se mostraram igualmente conservadas nas sequencias de B. caissarum. 
Entretanto, algumas substituições podem indicar seletividade por diferentes análogos de 
fosfolipídeos. As actinoporinas de anêmonas têm diferentes capacidades de hemólise, mas 
ainda assim existe bastante conservação na região correspondente à a-hélice N-terminal, 
que em geral é rica em aminoácidos hidrofóbicos. 
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Peptídeo Sinal Pró-peptídeo 






ACTP2 ACTEQ1-214 1 MSRLIIVFIVVTMICSATALPSKKI IDEDEEDE---.-.......... co... 33 
ACTPC ACTFR/1-181 nucescnccasuenacnncacesuo uns af nncvocfonncncaonoccnacacoc o. u 

MCTPÍ SINA anuais css ane E Sao af ia as Tina eram GEADA 

ACTPS ACTEQ1-214 1 MSRLIIVFIVVTMICAATALSSKKSIJNEDEKDE-.................... 33 
261681 g1.i1/1-215 1 MSRLIIVFIVVTMIFAAIALPSKNDNNEDYDEEE-............ 0... 34 
264268 g1.i1/1-212 1 MSRLIIVFIVISMICAAIALPSTKKAEEDDKDE-.................... 33 
264268 91.i4/1-212 1 MTRLF IVFIVI TMMCATIALSPAKKTNEEEKD-)-.................. 32 
264268 g1.i31-214 1 MTRLF IVF IVITMMCATIALSPAKKTNEEEKD.-|)................ o. 32 
264268 g1.i2/1-214 1 MSRLIIVFIVISMICAAIALPSTKKAEEDDKDE)--.-................. 33 


228100 g1.it/1-244 


1 










MKSFIVLELVLTLTYSTMSLPSEEFSEVODOVLERKEI PEDQELFKLEEFPEFRS4 
Pró-peptídeo ina 














ACTP2 ACTEGI1-214 34......clclccccccos EALGNVKRKI AGO 
ACTPG ACTFR/$O! Temas sussa sininsie rs isid o EALGNVKRKIA36 
ACTP4. STIHL/1-178 ee em are mia ra ed prio ELGKVSRKIA3S 
ACTPS ACTEQ/1-214 34... ..cccccccccscroo ALGDISRKIA6O 
B61EBI GLIVIDIS BD -cccccccrc cerco KALGD INRKIA7O 
OA GLIVISI G=sssesros cesso ALSDVSRKIA69 
DOMMOO quidNdiO Dssscssnáscciadarss ALAGT | [EGASLT | SVLEKVLOALGDISRKIA6S 
MG GL Decasssrise esses LAGTI [EGASLTISVLEKVLOALGD | SRKIA6S 
BONDES gLINIDIS Mec ccccrcoconc sacro KALSDVSRKIA6O 
228100 ot it/1.244 55 DVSNEVETSNDENDIKLN SGF .. . SREVS 103 


















70 VGVDNESGKTWTALNTYFR 





ACTP2 ACTEQ1-214 TSDIVLPHKVPHGKALLYNGOKDRGPVATG 123 
ACTPC ACTFR/1-181 37 VO IDNESGKTWTAMNTYER TSDIVLPHKVAHGKALLYNGOKNRGPVATO 90 

ACTP1 STIH4L/1-178 36 VGIDNESGGTWTALNAYFR TTDVILPEVVPNTKALLYSGRKSSGPVATO so 

ACTPS ACTEQ1-214 70 VOIDNESGMTWTAMNTYFR TSDVILPHTVPHGKALLYNGOKDRGPVATG 123 
261681 91.11/1-215 71 IGVDNESGRTWTG INTYFR TSDVILPRTVPSGKALLYDGAKNRGPVATGO 124 
264268 91.i1/1-212 70 IGIDNETGKSWTAMNTYFR TSDIILPNKVASGEALLYNGOKNRGPVATO 123 
264268 91.i4/1-212 69 IGIDNESGREWTAINTYFR TSDVVLPYTVPHGKALLYNGOKSRGPVATO 122 
264268 91131-214 60 IGIDNESGREWTAINTYFR TSDVVLPYTVPHGKALLYNGOKSROGPVATO 122 
264268 91. 12/1-214 70 IGIDNETGKSWTAMNTYF R TSDIILPNKVASGEALLYNGOKNRGPVATO 123 
228100 q1.11/1-244 104 IGVDNETHKRWTASNVYF TSDAVLPHTVPSSKALLYTARKT-GWSTNGS 156 

Ligação Fosfocolina Ligação Fosfocolina 
ACTP2 ACTEQ/1-214 124 VLAYLMS- DONTLAVL ME KGKRRADOR EL LS 176 
ACTPC ACTFR/1-181 01 MIAYSMS-DONTLAVL ME KGOKRADOR EL RS 143 
ACTP1 STIHL/1-178 00 AFAYYMS- NGNTLGVUM P, PGKRRADOG D -N141 
ACTP5S ACTEQ1-214 124 VLAYAMS-. DONTLAVL 0; KGHRRADOR EL LS 176 
261681 9111/1215 125 VLTYAMS. DONTLAVL vi KGKORANOR QL Y8177 
069268 91/1/1212 124 VLAYDMS- DONTLAVM vê SG IKRADOK EL NS 176 
264268 9114/1212 123 VVAYVSSNDAYTVAVM vi SGIKRADOK EL NS 176 
264268 91131-214 123 VVAYVSSNDAYTVAVM ME KGKRRADON DL AS 176 
264268 91 12/1-214 124 VLAYDMS. DONTLAVM yê KGKRRADON DL AS 176 
228100 g1. i1/1-244 157 VF TYHMS- DONTLAVL VIP, URGHRRAGKR A - K 208 
Sítio de adesão celular Ligação Fosfocolina Ligação Fosfocolina 

ACTP2 ACTEQ/1-214 GWHTRNLGYGLKSRIGFMNSSGHAILEIHVSKA 214 
ACTPC ACTFR/1-181 GCWHSRGLGYGLKSRIGFMNSSGHAILEIHVTKA 181 
ACTP1, STIHL/1-178 GWYOKNLGYGLRM) IMTSAGEAKMO IKISR- 178 
ACTP5S ACTEQ/1-214 GWHNRDLGYGLKGRIGFMNSSGOSILEIHVTKA 214 
261681 91.11/1-215 GWHSRNLGYGLKF FMNSSGKSILEIHVTKA 215 
264268 91.11/1-212 GWHSRS IGNGRTCEIGFMNSSGEAFLKIKVK-- 212 
264268 91.i4/1-212 GWHSRS IGNGRTCEIGFMNSSGEAFLKIKVK-- 212 
264268 91131-214 GWHSRNLOYGLKSRIGFMNSSGOAVLOIKVEQV 214 
264268 91.12/1-214 GWHSRNLGOYGLKSRIGFMNSSGOAVLOIKVEQV 214 
228100 q1 i1/1-244 HWRFRYLGOYGRRMBO YMTSSSKAALKIKVF - - 244 





Ligação a membrana 


Figura 14: Alinhamento de Actinoporinas. O alinhamento dos contigs completos de B. caissarum 
(mostrados em vermelho no dendrograma) com actinoporinas de anêmonas do mar bem estudadas. 
ACTP2 ACTEQ: Precursor da Equinatoxin-ll de Actinia equina (P61914); ACTPC ACTFR: a 
sequência madura da Fragaceatoxin C de Actinia fragacea (B9W5G6) e ACTP1. STIHL: toxina madura 
Sticholysin-l de Stichodactyla helianthus (P81662). A região do peptídeo sinal e propetídeo estão 
indicadas. A região correspondente ao sítio de endereçamento da secreção pra o nematocisto está 
indicada por uma caixa cor de rosa e o sítio de clivagem da toxina madura indicada por uma seta da 
mesma cor indicando o par de aminoácidos básicos (KR). A região da a-hélice N-terminal está indicada 
por uma caixa laranja e a parte importante para hemólise é indicada por pentágonos da mesma cor. 
A região rica em aromáticos está indicada por uma caixa vermelha e os sítios de contato inicial com 
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esfingolipídios de membrana estão indicados por caixas marcadas com pentágonos vermelhos. Os 
sítios de ligação com fosfocolina estão indicados com caixas marcadas com pentágonos verdes. 
Outros sítios de interação com lipídios da membrana celular estão indicados por caixas marcadas com 
pentágonos roxos e um provável sítio de adesão celular (RGD) está marcado com uma caixa marrom. 
Os números indicam a posição do resíduo no alinhamento. A escala de cores de conservação está 
indicada segundo a matriz BLOSUMG2. 


Além da alta similaridade e da conservação geral dos sítios de ligação, as 
actinoporinas de B. caissarum apresentaram na tabela 7 massas moleculares e pontos 


isoelétricos teóricos muito semelhantes aos descritos para outras actinoporinas conhecidas. 


Tabela 7: Massa molecular e PI teórico da região madura das actinoporinas de B. caissarum. 





Até o momento não existem descrições de actinoporinas em anêmonas do gênero 
Bunodosoma. Entretanto, de OLIVEIRA (50) relata que o perfil cromatográfico da peçonha 
B. caissarum apresenta dois picos majoritários com atividade hemolítica. Um pico 
denominado C1 corresponde a uma proteína com 15495 Da e tem atividade fosfolipásica 
que teve o seu N-terminal parcialmente sequenciado identificando essa toxina como uma 
PLA2. O outro maior pico denominado C3 apresentou uma massa de 19757 Da, sem 
atividade enzimática e a toxina purificada foi reconhecida por anticorpos anti-equinatoxin 
Il (ACTP2 ACTEQ: P61914). Esta citolisina foi denominada de Caissarolysin | (Bcs |) e 
que não foi sequenciada. Suas características de massa são compatíveis com as massas 
teóricas encontradas neste sequenciamento. 


Os níveis de expressão de cada contig foram comparados entre as populações de 
B. caissarum do litoral de sudeste (Bcs-SP) e do arquipélago (BCS-Ag) e estão mostradas 
no gráfico de expressão a seguir: 
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Figura 15: Gráfico da expressão das actinoporinas de B. caissarum. O gráfico compara o nível 
de expressão em FPKM (Fragments Per Kilobase Of Exon Per Million) de cada contig entre as duas 
populações de B. caissarum do Sudeste (Bcs-SP em azul) e do arquipélago (BCS-Aqg em vermelho). 


Na figura 10 verificamos os níveis de expressão dos contigs de actinoporinas 
nas duas populações de B. caissarum pertencentes à sub-familia de anêmonas do mar. 
Contigs cujos acertos do BLAST foram similares a sequências da sub-família Conoidea 
e sequenciamentos incompletos parciais não foram incluídos. Dos 6 contigs analisados 
3 foram expressos em ambas as populações, embora com níveis diferentes entre si. O 
contig c61681 g1 if com foi o mais expresso na amostra da população do arquipélago 
(BCS-Ag) enquanto que o contig c64268 91 i2 é a isoforma mais expressa na população 
do litoral (Bcs-SP compartilhando 83.9% de similaridade entre si. Ambos os contigs não 
são exclusivos de cada população, mas as expressões do mesmo contig na população 
oposta é cerca de 6 a 7 mil vezes menor. Eles representam a isoforma majoritária de cada 
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população. Os contigs c28100 g1 if, c64268 91 i4 e c64268 91 i2 foram expressos em 
diferentes níveis unicamente na Bcs-SP, o que indica uma maior diversidade de isoforma 
na população do litoral em comparação à do arquipélago. 

Outros, cinco contigs mostrados em roxo claro no dendrograma da figura 8 foram 
identificados pelo BLAST como sequencias similares a toxinas da subfamilia conoidea. 
Notavelmente a toxina, ACTP2 MONPT: Echotoxin-2 de Monoplex parthenopeus (Q76CA2) 
a pesar de pertencer a um gastrópode, também é incluída pelo banco de dados de toxinas 
do UNIPROT na subfamilia das actinoporinas de anêmonas do mar e foi acerto do BLAST 
com o contig c64761 92 i2. Entretanto, estes contigs tiveram um E-value baixo com ordens 
de grandeza entre 10º a 107, vide tabela 01. Desses apenas os contigs c123467 91.1; 
c64761. 92 i2; c60312 92 i3 são possivelmente completos, contendo posssível start e 
stop códons. A figura 05 a seguir mostra um alinhamento de actinoporinas de moluscos e 
os contigs de interesse. As actinoporinas da subfamília conoidea apresentam precursores 
geralmente maiores quando comparados com as de anêmona. O peptídeo sinal é maior 
com 24 aminoácidos e não contem pró-petídeos entre o peptídeo sinal e toxina madura. O 
propetídeo, quando existe, é C-terminal. Portanto, a sequência de endereçamento consenso 
para o nematocisto (DEDEDIEKR) das actinoporinas de anêmona não está presente nas 


toxinas de moluscos. 
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c60312 92 13/1-237 Teco. MAGTVDFQOA--.... ALDLASRIVP--..DIVKVNOVRDAIASLDGOGGAQFGNLFOLLAEGOGRRN 57 
0123467 91. 11/1-225 RR O AAGASIVA----NSDKIAKVAGAISSLDAQGWT.- - - . WEGLACEGGGRRN 45 
ACTP2 MONPT/1-275 GO YSVTO----- VIEVENWTKHLMKYPVVQ IANSGGLLTVAKNVLPAE |OSFAMRKAW-GANGVYBTVSWVLGO 131 
ACTP CONCN/1-248 GI YNITO----- TLOVENWIRYRLIVPSVOMVY-GVVTTTPIAILEPAKREAFAVRKTSDTASGVAGSVSWELEK 128 
c64761 g2.i2/1-233 52 EMSI INGTSHAA ILDGWYLEWGNCKVPPEPH--...... LYSMSRDESLFHNAGSW-ACTOSSGVVTYRLG- 113 
c60312 92 13/1-237 58 AMSICNGTDHDIOLVKWYLHHGHNKVPATPY-.-.....- LLSMKODDSLEHNAGSW- AATOSSGVVTYMLO- 119 
0123467 91./1/1-225 40 TMSICNGTDHALELERI YLHWOKCKVPPDAY--...... ITSMKODDCLEHNAGSW- AATOSSO IVTYKLO- 107 
Ligação Fosfocolina Contato inicial Ligação Fosfocolina 
ACTP2 MONPT/1-275 132 TNRRVVÍ SRPG-.DAVPSSR--...- STW............ FDL NSNADI 184 
ACTP CONCN/1-248 120 ARRRF VIMWSVPDNENSFGYWMGLGMTREG-LVDPDK---.-...- DW............ Y6OMYSGSSDGDL 179 


c64761 92 12/1-233 
c60312 92 13/1-237 
0123467 91.11/1-225 


ACTP2 MONPT//1-275 
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06476192 12/1-233 
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0123467 91111-225 
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060312 92 131.237 
0123467. 9111/1225 


114 YHTSLHIMWECPYNFDFDDNYIGLMLTSESHLTKPNKHVFOGMFGDGKK IGMSPSYOSKYDLVCCGPGONONS 185 
120 COTNLHIMWECPYNFDLHDNYIGLMLTTEEDLKKPNKHLFLAMF EDWNSMGKTPRAGSTYDLVCCGPONGGOS 191 
108 YNTNLHIMWDCPFNEDYSDNF IGLMLTSNSALLSPDEILFKNMYODWKELNLTPSKESTYDLVCCOPGKAGS 179 
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Figura 16: Alinhamento dos contigs similares a Actinoporinas de Conoidea. Usando como 
referência o contig c64761 92 i2, os contigs mais similares a actinoporinas de moluscos (em roxo 
claro no dendrograma da figura 02) foram comparados com ACTP2 MONPT: precursor da Echotoxin-2 
de Monoplex parthenopeus (Q76CA2). A região do peptídeo sinal e do pró-peptídeo estão indicados na 
figura em preto. A região N-terminal é indicada por uma caixa laranja e os resíduos importantes para 
hemólise são indicados por pentágonos laranjas. Os sítios de ligação com fosfocolina estão indicados 
em verde. A região rica em aromáticos e o sítio de ligação inicial a esfingomielina estão indicados 
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em vermelho. Os números indicam a posição do resíduo no alinhamento. A escala de cores de 
conservação está indicada segundo a matriz BLOSUM62. 


Caracteristicamente nenhum dos contigs encontrados como acertos no BLAST de 
toxinas do UNIPROT apresentaram peptídeos sinais preditos pelo SignalP. Entretanto, é 
possível encontrar o sinal consenso de Kozak eucariótico clássico (51) que determina o start 
codon nestes contigs originando ORFs completos que se traduzem em proteínas preditas 
maiores com em média 234 aminoácidos, enquanto que os precursores de actinoporinas de 
anêmonas normalmente tem 214 aminoácidos. Mas, nenhum peptídeo sinal foi identificado 
pelo SignalP. Também observamos a presença de cisteínas na sua cadeia de aminoácidos, 
algo incomum para actinoporinas clássicas. A similaridade das sequencias alinhadas na 
figura 05 com Echotoxin-2 de molusco é menor que 30% e a maioria dos sítios de ligação 
com lipídeos não está conservada conforme o indicado por (19) para a Echotoxin-2. 


Estes contigs também encontram acertos com outras proteínas não presentes no 
banco de dados de toxinas do UNIPROT. Como por exemplo, sequências preditas do 
genoma da anêmona Nematostella vectensis (XP 001633907.1) e outras sequências 
preditas de peixes contendo o domínio do PFAM (PF06369) de Actinoporinas de anêmonas, 
mas estas sequencias ainda estão sobre revisão e também não apresentam peptídeos 
sinais. 

Evidentemente estas sequencias contém um domínio similar ao das actinoporinas, 
mas não devem ser toxinas inclusive devido à ausência de um peptídeo sinal, falta da 
sequência consenso de endereçamento para o nematocisto e por serem muito divergentes, 
talvez elas possam ser resultado relictual de uma transferência horizontal de genes de 
citolisinas de microrganismos unicelulares para cnidários. Não existe evidências dessa 
teoria em toxinas de anêmonas, portanto isso é apenas uma teoria. 


ANÁLISE DOS TRANSCRITOS SIMILARES A TOXINAS BLOQUEADORAS DE 
CANAIS DE POTÁSSIO DEPENDENTE DE VOLTAGEM DO TIPO | - SHKT 


Encontramos 20 contigs no nosso sequenciamento que se assemelham às toxinas 
bloqueadoras de canal de potássio do tipo 1 e que possuem apenas um único domínio 
ShKT, apresentados na tabela abaixo: 


Resultados e discussão EE 


SITÓIA LH e pa BUNGA Kappa-actitoxin-Bes3b ES 
C116940 91H Ra ANEVE U-actitoxin-Avd9a Ea 
FE RR ANEM area GESA 
esbidSgA E PRN U-actitoxin-Avdtta ESA 
c68752 93 1 na Kappa-actitoxin-Bgria 204E-19 
c68752 93 i2 Te Kappa-actitoxin-Bgria 8,62E-19 
c68752 93 i3 pr Kappa-actitoxin-Bgrla 1.85E-18 
c68752 94.11 ea Kappa-actitoxin-Aeq4a 5 17E-13 
c103967 91. ANE Kappa-actitoxin-Aer3a Eai 
c39229 g1.i1 RR Rappa-seonio 2,06E-20 
c39229 91 i2 ER RApparaouonio 1,85E-18 


Tabela 8: Toxinas bloqueadoras de canal de potássio do tipo 1 em Bcs 


A tabela mostra os contigs identificados na biblioteca das populações de B. 
caissarum similares às toxinas bloqueadoras de canal de potássio do tipo |, de acordo 
com o Resultado do BlastX contra o banco de dados de toxinas animais do UniprotKB, o 
respectivo e-value e a classificação da família segundo a análise do dendrograma e do 
alinhamento discutido abaixo. A coluna subtipo representa o subtipo da toxina que resultou 
do BLAST de cada contig. 
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Os contigs presentes na tabela possuem o precursor semelhantes às toxinas 
conhecidas da família, variando de 306 a 960 nucleotídeos, porém para melhor 
visualizarmos a similaridade das sequencias com as toxinas já conhecidas e bem descritas 
pertencentes à família de bloqueadores de canais de potássio dependentes de voltagem 
do tipo |, fizemos um alinhamento dos contigs em suas formas completas, apresentado 
na figura n. A única exceção dentre todas sequencias foi o contig c87952 91. if, com 270 
aminoácidos no mínimo em sua cadeia proteica, já que não foi possível estimar o número 
total de aminoácidos pois não existe informação sobre start e stop códon em sua sequência. 
Analisando o contig na ferramenta de busca de domínios conservados do NCBI verificamos 
que o mesmo possui um domínio ShKT conservado em sua sequência, por isso o BLAST 
acusou como um possível resultado contra toxinas ShkK-like. Por esse motivo esse contig 
foi excluído de nossas análises posteriores. 
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A caixa em vermelho no alinhamento, com o polígono localizado logo acima, 
temos posições mais importantes para a função bloqueadora dessas toxinas, que inclui a 
díade funcional dessa família de toxinas. Em laranja se encontra os resíduos que possuem 
atuação em canais de potássio, porém a sua importância para a função bloqueadora não é 
tão fundamental como outros resíduos. Esses resíduos não apenas indicam o canal Kv1.3 
como alvo, mas também Kv1.1, Kv1.2, Kv1.6, Kv3.2 e KCaB.1. 


No alinhamento apresentado na figura 17 cada sequência foi analisada em busca do 
seu possível peptídeo sinal através do algoritmo SignalP, que encontrou sinal de clivagem 
em todas sequencias. Para designarmos o possível pró-peptídeo de endereçamento 
para o nematocisto nos contigs todos os aminoácidos seguintes ao peptídeo sinal até a 
díade básica característica que indica o ponto de clivagem para a parte da toxina madura 
(29) foram considerados como própeptídeo. Porém os contigs c36937 g1 if e c120283 
g1. if não apresentaram a díade característica, embora o contig c36937 g1 if possua 
uma arginina numa posição semelhante a outra sequencias, que foi considerada como 
possível ponto de clivagem. No contig c120283 91 il foi encontrado uma díade KR 3 
aminoácidos seguintes ao peptídeo sinal, característica que a difere em muito das toxinas 
e de outras sequencias, talvez representando que esse contig não possua características 
de toxina. Para melhor visualização da correlação entre as toxinas conhecidas e nossos 
contigs foi construido um dendograma usando como base o alinhamento discutido, que 
está apresentado na figura a seguir. 
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48 c68752 93 11/1-74 
à K1B BUNGR/1-37 
9 c68752 93 i2/1-74 
43 c68752 93 3/1-74 
c17614 g1 i1/1-90 
36 K1B2 BUNCI/1-37 
K1B1 BUNCI/-38 
eg c64871 g1 i1/1-79 
6 c18859 91 11/1-77 
c53259 91 11/1-81 
30 c68752 g4 i1/1-84 
60 K1B ACTEQ/1-36 
c36937 91 11/1-81 
c80103 g1 11/1-86 
a? c39229 91 i1/1-80 
c39229 91 i2/1-67 
c103967 91 11/1-70 
48 KIA STIGI1-74 
a K1A STIHL/1-35 
97 K1A THAAS/1-75 
74 K1A HETHE/1-75 
c90258 91 11/1-73 
73 c473 91 11/1-87 
97 c61431 91 11/1-89 
c116940 g1 11/1-83 
8 c120283 91 11/1103 


n 


19 


23 


84 


Figura 18: Dendograma dos contigs similares às toxinas da família de bloqueadoras de canal 
de potássio do tipo 1. O dendrograma foi montado por neighbour joining utilizando um modelo de 
substituição JTT de acordo com um alinhamento feito por Muscle. Os códigos correspondem às 
seguintes toxinas: K1A STIHL: Kappa-stichotoxin-She3a (ShkK) de Stichodactyla helianthus (P29187). 
K1A HETMG: Kappa-stichotoxin-Hmgta de Heteractis magnifica (016846). K1A STIGI: Kappa- 
stichotoxin-Sgt4a de Stichodactyla gigantean (E2S061). KIA HETHE: Kappa-thalatoxin-Hhe2Za de 
Heterodactyla hemprichii (E2S065). K1B2 BUNCI: Kappa-actitoxin-Bcs3b (BcsTx2) de Bunodosoma 
caissarum (COHJC3). K1B BUNGR: Kappa-actitoxin-Bgrta (Bgk) de Bunodosoma granulifera 
(P29186). K1B1. BUNCI: Kappa-actitoxin-Bcs3a (BcsTx1) de Bunodosoma caissarum (COHJC2). 
K1B ACTEQ: Kappa-actitoxin-Aegq4a de Actinia equina (P81897). Em vermelho se destaca um grupo 
de contigs que tiveram similaridade às toxinas do subtipo 1b (BgK). Em magenta se encontra um contig 
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que se mostrou o mais intermediário entre o tipo ta e 1b. Em azul se destaca contigs que possuem 
certa semelhança com às toxinas do tipo 1a (ShkK). Em vende estão os contigs do tipo 1b que possuem 
maior identidade com as toxinas do subtipo 1a. Em laranja representa toxinas também do subtipo 1b, 
porém com maior divergência do que a anteriores, por isso ficaram destacadas no dendograma. 


No grupo destacado pela cor vermelha temos 8 contigs (c68752 g3 il, c68752 
g3 i2, c68752 93 i3, c17614 g1. if, c64871 g1. if, c18859 gl. if, c53259 gt il e 
c68752 94 if) temos os contigs que mais se aproximaram das toxinas do tipo 1b (Bgk). 
O contig c17614 91. if possui e-value de 5,00E-21 e 97,3% de identidade com a toxina 
K1B BUNCI, de Bunodosoma caissarum, que pode significar que encontramos em nossos 
contigs a sequência percussora dessa toxina, já que a mesma possui apenas sua parte 
madura conhecida e anotada. Os contigs c68752 93 il, c68752 g3 i2,c68752 93 i3 são 
isoformas de um mesmo transcrito, possuindo e-value entre 1,00E-19 e 4,00E-20 para a 
toxina K1B BUNGR, de Bunodosoma granuliferum, com identidade variando de 89,2% e 
91,9%. Também é possível notar como o contig c68752 g4 il se destacou dos contigs 
anteriores, ficando num ramo isolado com a toxina K1B ACTEQ e como o contig c53259 . 
g1. if se mostrou isolado entre o c68752 g4 il e as outras, talvez sendo um intermediário 
entre essas possíveis isoformas. Essas diferenças podem indicar que diferentes isoformas 
de toxinas do subtipo 1b estão presentes no transcriptoma de Bunodosoma caissarum. 


Os contigs destacados com a cor magenta no dendrograma são dois contigs 
(c36937 91. if e c80103 g1 if) que apresentaram características que os colocam como 
intermediários entre as toxinas do tipo 1b e 1a. Analisando o alinhamento desses contigs 
é possível observar que após a primeira cisteína os aminoácidos do contig c80103 91. 
if não são tão conservados em relação aos outros mais similares às toxinas do subtipo 
1b, enquanto que no contig c36937 g1 if possua maior conservação. Os dois contigs 
apresentam também a inserção de quatro aminoácidos, característica das toxinas do 
subtipo 1b. 


O grupo azul contém três contigs (c39229 91 i1, c39229 gl iZ e c103967 g1.if) 
que mais se assemelharam às toxinas do tipo 1a, o que é algo nunca antes detectado na 
análise de toxinas da Bunodosoma caissarum. O valor de e-value desses contigs foram de 
2,06E-20 para o contig c39229 g1 if com a toxina Kappa-actitoxin-Aer3a (QOEAE5) da 
Anemonia erythraea, com 60% de similaridade, no contig c39229 91 i2 temos e-value de 
3,00E-19, possuindo 76,2% de identidade com a toxina Kappa-actitoxin-Aer3a (QOEAE5) 
da Anemonia erythraea e e-valuede 3,00E-31 para o contig e c103967 91. if também 
com a toxina Kappa-actitoxin-Aer3a (QOEAE5) da Anemonia erythraea, com 68,1% de 
identidade. 


O grupo verde possui 3 contigs (C90258 91 i1,c473 gl ife c61431 91 il) que se 





destacaram dos grupos anteriores, ficando em ramos destacados dentro do dendrograma. 
Esses 3 contigs possuem a inserção característica do subtipo 1b, com as cisteínas 
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conservadas, porém no geral seus aminoácidos apresentam muitas diferenças em relação 
aos outros contigs. Também não foi encontrado os resíduos importantes para a ação 
bloqueadora de canais de potássio. 


Por fim temos o grupo amarelo, com dois contigs (cC116940 g1 itec120283 g1.i1) 
que apresentaram as características mais divergentes do restante, ficando destacados no 
dendrograma. O contig c116941 91 if possui certas características em comum com os 
contigs e toxinas anteriores, como as cisteínas e possíveis pontes dissulfeto conservadas 
e a díade funcional bloqueadora de canais de potássio (nesse contig a tirosina (Y) foi 
substituído por uma fenilalanina (F), compartilhando a propriedade de aminoácido 
aromático), seu e-value foi de 5,32E-08, com 41% de identidade, com a toxina K1B9A | 
ANEVI (U-actitoxin-Avd9a [PODNOO]), pertencente ao subtipo 1b. 


O contig c120283 91 if se mostrou completamente divergente das demais, com 12 
cisteínas presentes na sua cadeia peptídica, totalizando 6 possíveis pontes dissulfeto, o 
dobro do esperado para toxinas da família aqui estudada. Outra característica divergente é 
o tamanho do possível propeptídeo desse contig, com apenas 5 aminoácidos até o possível 
ponto de clivagem na díade básica KR. Suas características indicam que provavelmente 
não se trata de uma toxina. Seu e-value no BLAST foi de 5,12E-07 e 38% de identidade 
com a toxina K1B9A ANEVI (U-actitoxin-Avd9a [PODNOO]), pertencente ao subtipo 1b. 


Os contigsc17614 gi ifec18859 91 if foram os contigs que mais se aproximaram 
das toxinas bloqueadoras de canal de potássio do tipo 1 de Bunodosoma caissarum já 
depositadas em bancos de dados e analisando o alinhamento verificamos que esses 
contigs são realmente as toxinas já conhecidas, porém agora temos acesso à informação 


do seu precursor completo. 


Atualmente foram identificados na família de anêmonas Bunodosoma apenas toxinas 
bloqueadoras de canal de potássio do tipo 1, subtipo 1b, que é justamente a Bgk, da 
anêmona Bunodosoma granulifera, então é natural encontrarmos maior parte dos contigs 
semelhantes à esse subtipo, porém encontramos três contigs que contém as características 
do subtipo ta (ShkKT), o contig c103967 g1 il, c39229 91. if e c39229 g1 i2. Seus 
precursores estão completos, com start e stop códon, e a característica do subtipo ta em 
relação com o subtipo 1b também está presente, que é a falta de 4 aminoácidos logo antes 
da terceira cisteína. Então é possível que esses transcritos sejam realmente de uma nova 
toxina. 


Abaixo segue a imagem com a modelagem de contigs que consideramos os mais 
relevantes com base em toxinas bem estudadas. 
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Figura 19: Modelagem de alguns contigs em relação a ShK e BgkK. A toxina ShK (modelo 4LFS) 
está representada em verde. BgK (modelo 4Z7P) em roxo claro. O contig c39229 em azul claro, contig 
c18859 em salmão, c116940 em amarelo e c473 em laranja. Na modelagem em verde representa as 
pontes dissulfeto, em laranja os resíduos com relevância para o bloqueio e em vermelho os resíduos 
importantes para a função bloqueadora de canais de potássio. Em roxo se encontra os resíduos que 
provavelmente não compartilham das mesmas funções que os resíduos nessas posições nas toxinas. 
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Na figura acima temos a modelagem dos contigs c39229 g1 if, modelado com 
base na Shk, c18859 91 i1, c116940 g1 if e c473 g1 if modelados com base na Bgk. 
No contig c39229 91 i1 é possível identificar semelhança na estrutura geral do contig em 
relação à toxina, embora tenha algumas diferenças no N-terminal, por volta dos resíduos 
de número 10. Encontramos os resíduos L06, S19, K21 e Y22 em posições semelhantes à 
ShkK e mantendo as mesmas características físico-químicas, porém os resíduos E10 e N26 
não compartilham essas características. 


Já em relação à BgK temos o contig c18859 g1 il, que se mostrou o mais próximo 
da Bgk, com a sua estrutura, os resíduos importantes e as pontes dissulfeto altamente 
semelhantes a toxina. Os contigs c166940 g1 if e c473 91 if possuem semelhança 
estrutural com a BgK, porém quando analisamos os resíduos importantes para a função 
bloqueadora de canal de potássio encontramos discrepâncias. No Contig c166940 gt. ita 
díade funcional KY está presente, porém a Serina que está presente na posição 23 na BgK 
se encontra substituída por uma Lisina, que não possui as mesmas características físico- 
químicas, e no contig c473 g1 il nenhum desses resíduos importantes é encontrado, o 
que talvez signifique que esse contig não possua função tóxica. 


Abaixo se encontra o gráfico comparativo da expressão nas duas populações de 
Bunodosoma caissarum dos contigs analisados: 
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Na figura 20 podemos observar os diferentes níveis de expressão de cada população 
nos contigs ShkK-like analisados. Primeiramente o que logo se destaca no gráfico é a 
diferença de expressão entre as duas populações, com a Bcs-Aq atingindo picos bem mais 
elevados se comparado a Bcs-SP. Isso pode ocorrer devido a necessidade da população 
do arquipélago de expressar mais esse tipo de toxina, talvez contra algum tipo de presa 
mais suscetível à essa família de toxinas. Porém isso é apenas uma teoria, não existindo 
fatos científicos que comprovem isso. 


Dos 19 contigs analisados apenas 5 tiveram expressão identificada em ambas 
populações, embora com picos bem divergentes entre si. O contig com maior expressão 
é 0c17614 g1 il, com expressão de 2410,73 pela Bcs-Aqg, enquanto o contig com maior 
expressão pela Bcs-SP é o c64871 g1 if, com expressão de 65,31. Porém embora a 
expressão seja muito mais alta na população do arquipélago, o gráfico também indica 
uma maior diversidade nas isoformas dessas toxinas na Bcs-SP, 13 contigs apresentando 
expressão nessa população, enquanto que na Bcs-Aq temos 10 contigs. 
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CONCLUSÃO 


Nosso trabalho teve sucesso em sequenciar as duas populações de Bunodosoma 
caissarum. Nosso objetivo de encontrar prováveis novas toxinas também foi alcançado, 
como demonstrado nos capítulos específicos das famílias Actinoporinas e toxinas 
bloqueadoras de potássio do tipo | (ShK). Também identificamos outras possíveis famílias 
de toxinas, portanto um estudo mais aprofundado de cada família também seria necessário. 


Em relação a expressão podemos concluir que existe diferenças entre os níveis 
de toxinas entre as diferentes populações, o que deve ocorrer devido à grande distância 
existente entre a costa do estado de São Paulo e o Arquipélago São Pedro e São Paulo, o 
pode resultar em animais diferentes para serem predadas, assim como o próprio ambiente 
mais eutrofizado da região da costa de São Paulo. 
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pública, para entendimento dos mecanismos moleculares que governam os sistemas 
biológicos. (Texto informado pelo autor) 


GANDHI RÁDIS BAPTISTA - Bolsista de Produtividade em Pesquisa do CNPq - Nível 
2. Endereço para acessar este CV: hittp:/llattes.cnpq.br/5322192969141529. ID Lattes: 
5322192969141529. Graduado em Farmácia Bioquímica pela Universidade de São Paulo 
(1993), mestre em Tecnologia Bioquímico-Farmacêutica pela Universidade de São Paulo 
(1996) e doutor em Bioquímica pela Universidade de São Paulo (2001). Professor Adjunto 
do Departamento de Bioquímica da Universidade Federal de Pernambuco (2005-2008). 
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Atualmente, Professor Associado do Instituto de Ciências do Mar da Universidade Federal 
do Ceará. Membro da Sociedade Americana de Química (American Chemical Society, 
ACS), desde 2010. Os principais interesses de investigação compreendem os peptídeos e 
as proteínas farmacologicamente ativos provenientes de organismos marinhos e terrestres; 
os receptores celulares e seus ligantes; a interação molecular; a tecnologia do DNA 
recombinante; o diagnóstico molecular e seus insumos; o direcionamento intracelular e a 
compartimentalização de polipeptídeos. (Texto informado pelo autor) 


IRINA KERKIS - Bolsista de Produtividade em Pesquisa do CNPq - Nível 1D. Endereço para 
acessar este CV: http://lattes.cnpq.br/4302687618153569. ID Lattes: 4302687618153569. 
Possui graduação em Biologia e Quimica pela Universidade Federal de Tomsk (1978), 
mestrado em Biologia e Quimica pela Universidade Federal de Tomsk (1981) e doutorado em 
Citogenética pelo Instituto de Citologia e Genética (1989). Reconhecimento pela Universidade 
de São Paulo de Título de Doutor em Ciências - área Biologia (Genética) em 2004. Obteve 
Livre-Docência em Ciências Biológicas pela Academia de Ciências da Rússia em 1994, 
Atualmente ela é a diretora do Laboratório de Genética do Instituto Butantan e Pesquisadora 
nível VI do Instituto Butantan. Ela tem uma vasta experiência, liderança, e treinamento em 
Biologia Celular, especificamente na area de obtenção, caracterização e produção em alta 
escala de diversos tipos das celulas tronco embrionárias e pluripotentes induzidas, assim 
como adultas - mesenquimais e células tronco germinativas. Seu foco atual é a medicina 
translacional utilizando celulas tronco imaturas de polpa dentária humanas em doenças 
neurodegenerativas e hematopoieticas. Além disso, ela atua na area de toxinas - peptídeos 
penetrantes de células, tais como a crotamina isolada do veneno das serpentes brasileiras 
e utilizada como o marcador de células proliferamente ativas, de ciclo celular, assim como 
carreador de DNA/ RNA ou outras moléculas biologicamente ativas para o interior das células. 
Ela publicou mais de 90 artigos científicos, 20 capítulos de livros e produziu cinco patentes, 
três delas já foram concedidas. Ela também atuou como palestrante principal em eventos 
científicos nacionais e internacionais e recebeu vários prêmios. (Texto informado pelo autor) 


ÁLVARO ROSSAN DE BRANDÃO PRIETO DA SILVA - Endereço para acessar este CV: 
http:/attes.cnpq.br/2277174467541698. ID Lattes: 2277174467541698. Possui graduação 
em Medicina Veterinária pela Universidade de São Paulo (1991) e doutorado em Ciências 
Biológicas (Bioquímica) pela Universidade de São Paulo (2002). Atualmente é pesquisador 
científico do Instituto Butantan, onde é vice-diretor do Laboratório de Genética. Atua nade 
Bioquímica, com ênfase em Biologia Molecular e Química de Proteínas. Os principais 
interesses de investigação compreendem: os polipeptídeos bioativos, toxinas animais e 
seu alvos, receptores celulares e seus ligantes; a interação molecular; a tecnologia do DNA 
recombinante: clonagem e expressão, bibliotecas de cDNA de organismos peçonhentos, 
RT-PCR. Análise e produção de antigenos e imunobiológicos. Atuando principalmente 
nos seguintes temas: toxinas, neurotoxinas, clonagem purificação de proteínas, antígenos 
recombinantes e sorologia. Crotalus, Micrurus, Cnidiários, Himenópteros. (Texto informado 
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pelo autor) 


INÁCIO DE LOIOLA MEIRELLES JUNQUEIRA DE AZEVEDO - Bolsista de Produtividade 
em Pesquisa do CNPq - Nível 2. Endereço para acessar este CV: http:/attes.cnpq. 
br/9499590129608919. ID Lattes: 9499590129608919. Possui graduação em Ciências 
Biológicas pelo Instituto de Biociências da Universidade de São Paulo (1998), doutorado 
em Biologia e Genética pela Universidade de São Paulo (2003) e pós-doutorado na área 
biotecnológica pelo Instituto Butantan (2004). Atualmente é Pesquisador Científico do Instituto 
Butantan, sendo diretor do Laboratório de Toxinologia Aplicada. Tem experiência nas áreas 
de genômica, transcriptômica e biologia molecular em geral, com ênfase em sequenciamento 
de DNA em larga escala. Atua principalmente nos seguintes temas: análises ômicas de 
venenos animais e de seus efeitos, evolução de venenos de serpentes, bioquímica de toxinas 
e biotecnologia. (Texto informado pelo autor) 


ANDRE JUNQUEIRA ZAHARENKO - Endereço para acessar este CV: http:/llattes.cnpq. 
br/3955659940007123. ID Lattes: 3955659940007123. Graduado em Ciências Biológicas 
pela USP (2000) e Doutor em Fisiologia Geral pelo Instituto de Biociências da USP em 2007. 
Atuação na área de Toxinologia Marinha, principalmente em neurotoxinas de anêmonas do 
mar. Dedicou-se ao isolamento e determinação estrutural de peptídeos e compostos de baixa 
massa molecular (utilizando técnicas cromatográficas e de biologia molecular, bem como 
espectrometria de massas) e da caracterizacão dos efeitos biológicos, através de experimentos 
eletrofisiológicos. Possui em andamento colaborações com outros grupos estrangeiros 
visando a determinação estrutural e análise de estrutura-função de peptídeos que interagem 
com canais iônicos, bem como a investigação de aspectos biofísicos que regem a atividade 
de canais modulados por toxinas. Realizou de 2011-2015 (pós-doc) a análise transcriptômica 
de toxinas destes organismos através de técnicas de sequenciamento de DNA de nova 
geração. Atualmente atuando na indústria farmacêutica (Novartis Corporation) na posição de 
MSL (Medical Scientific Liaison), na área de oncologia (tumores sólidos). Responsável pela 
prospecção de Centros de Pesquisa Clínica e implementação de protocolos de pesquisa 
clínica em diversos hospitais e serviços públicos pelo país. Bem como discussão de racional 
molecular de novas drogas no segmento, com stakeholders externos e internos e líderes de 
opinião em oncologia. (Texto informado pelo autor) 
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